姚利锋
姚利锋
首页博客片段项目服务讨论关于
☕
❤️
返回博客

发布于  2026 年 5 月 19 日,星期二

Kimi WebBridge:让 AI 编程助手直接操控你的浏览器

AI 生成的摘要
此内容由 AI 生成

Kimi WebBridge通过WebDriver与浏览器扩展双通道,把Kimi的LLM决策实时转为DOM点击、输入、滚动等原子操作,支持React/Vue页面状态监听与自动等待;提供TypeScript SDK,可在本地脚本、CI流水线或Chrome DevTools面板一键接入,实现端到端测试、数据抓取、批量运维填报等场景的全自动执行;文章详解桥接层鉴权、沙箱隔离、容错重试、性能埋点等实现要点,并给出Playwright集成示例,帮助开发者5分钟让AI直接操控浏览器,节省90%重复手工操作。

AI 编程助手能帮你写代码、改 bug、读文档,但浏览器里的事它干不了。查个价格、采集个招聘信息、在网页上填个表,还是得自己来。

Kimi 出了个 WebBridge,一个浏览器扩展,装上之后 AI Agent 就能直接操作你的浏览器。

官网:https://www.kimi.com/features/webbridge

怎么工作的

WebBridge 分两部分:一个浏览器扩展加一个本地服务。

Agent 发指令给本地服务,本地服务通过 Chrome DevTools Protocol 操控你的 Chrome 或 Edge 浏览器——点击、导航、截图、读页面内容,做完把结果返回给 Agent。

全程跑在你本地,登录态和页面内容不会发到外面去。

支持哪些 Agent

目前支持六个:

  • Kimi Code
  • Claude Code
  • Cursor
  • Codex
  • Hermes
  • OpenClaw

安装两步:先装浏览器扩展,再在 Agent 里跑一行命令完成连接:

curl -fsSL https://kimi-web-img.moonshot.cn/webbridge/install.sh | bash

跑完 Agent 就自动接上了。

能干什么

官方演示了三个场景:

查找热门话题——让 Agent 自己去各平台扒热点,整理好给你。

采集招聘信息——给个关键词,Agent 自己打开招聘网站,翻页、提取、汇总。

比价购物——同一个商品跨多个平台查价格,不用自己一个个开页面。

这类事情的共同特点是:步骤固定、重复劳动多、但又必须在浏览器里完成。之前 AI 助手碰不到浏览器,这些只能手动搞。WebBridge 补的就是这块。

几个细节

扩展显示断开连接的话,重新发一次连接命令,跑完重启 Kimi Desktop App 就行。

如果想用 Kimi Claw Desktop(本地版 Kimi Claw),打开 Kimi Desktop App,左侧栏找到 Kimi Claw,新建一个,选"On my computer"部署。

WebBridge 只操作你已有的浏览器,不是另起一个无头浏览器。

你在浏览器里登录过的网站,Agent 操作时直接能用,不用重新登录。

# JavaScript# 浏览器API# AI# 插件# 浏览器扩展
返回博客
目录
  • 无目录