还在手动查价格、填表单、截图存档?OpenClaw 能让你的 AI 助手直接操控浏览器,一句话搞定重复性网页操作。
你有没有这样的经历:每天打开十几个网页查数据、反复登录同一个网站填表单、手动截图保存信息……这些"机械劳动"占了大量时间,但又不得不做。
2026 年,OpenClaw 推出了一个杀手级功能——浏览器自动化。它不只是"能打开网页"那么简单,而是让 AI 真正"看懂"网页内容,理解你的意图,然后自动完成操作。
苏米注:更厉害的是,2026.3 版本新增了 Chrome DevTools Attach Mode,可以直接接管你正在使用的浏览器,利用已有的登录状态完成操作,无需重新登录任何账号。
浏览器自动化原理
OpenClaw 浏览器自动化的底层技术是 Chrome DevTools Protocol (CDP)。简单来说,OpenClaw 通过 CDP 协议与 Chrome 浏览器通信,获取网页结构、操控页面元素、执行点击和输入操作。
和传统的 Selenium、Playwright 不同的是:
| 特性 | 传统自动化 | OpenClaw 自动化 |
|---|---|---|
| 操作方式 | 写脚本、定位元素 | 自然语言描述需求 |
| 异常处理 | 手动处理 | AI 自动适应 |
| 网页改版 | 脚本失效 | 自动适应布局变化 |
核心能力一览:
- 🌐 页面导航:打开 URL、前进后退、刷新
- 📸 截图捕获:全页截图、区域截图
- 🖱️ 交互操作:点击、输入、选择、滚动
- 📄 内容提取:读取文本、提取表格、获取链接
- 🔄 表单填写:自动填写登录表、搜索框等
- 📑 多标签管理:同时操作多个标签页
基本操作:用自然语言控制浏览器
启动浏览器
OpenClaw 默认会启动一个隔离的浏览器实例。你可以直接在聊天中发出指令:
帮我打开 https://www.baidu.com 并搜索 "OpenClaw 教程"
OpenClaw 会自动:启动浏览器 → 导航到百度 → 找到搜索框 → 输入搜索内容 → 点击搜索按钮。
截图网页
帮我截取 GitHub 首页的截图
打开这个链接,截取整个页面的长截图:https://openclaw.ai
提取网页信息
打开这个知乎页面,帮我提取文章标题和前 5 条评论:
https://zhuanlan.zhihu.com/p/xxxxxx
表单自动填写
帮我打开这个注册页面,填写:
- 用户名:testuser123
- 邮箱:test@example.com
- 密码:MyPass2026!
然后截图确认填写结果
高级玩法:接管你的 Chrome 浏览器
这是 2026.3 版本最重磅的功能。之前,OpenClaw 启动的是一个全新的浏览器实例,你需要重新登录所有网站。现在,它可以直接接入你正在使用的 Chrome。
启用方法
1. 以远程调试模式启动 Chrome(macOS):
/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome \
--remote-debugging-port=9222 \
--user-data-dir="$HOME/Library/Application Support/Google/Chrome"
2. 在 OpenClaw 中使用 user profile 连接:
在聊天中直接发出指令:
用我当前的 Chrome 浏览器,帮我打开淘宝,搜索 "机械键盘",
然后截取前 5 个商品的标题和价格
OpenClaw 会自动检测到正在运行的 Chrome 实例,并接管控制权。
实际应用场景
场景一:电商价格监控
每隔 2 小时帮我查一下京东上 AirPods Pro 的价格,
如果低于 1200 元就通知我
场景二:自动化数据采集
打开这个网站,翻到第 5 页,把所有文章标题和链接整理成表格发给我
场景三:网页表单批量填写
帮我依次打开这 5 个链接,每个页面都填写相同的表单内容:
- 姓名:张三
- 电话:13800138000
- 备注:咨询产品信息
填完后截图确认
将浏览器操作封装为可复用技能
如果你经常重复同一个浏览器操作流程,可以把它封装成一个 Skill,以后一句话就能调用。
创建技能示例
假设你每天都需要查某个电商平台上特定商品的竞品价格,可以创建这样一个技能:
在 OpenClaw 工作区中创建技能目录:
mkdir -p ~/.openclaw/workspace-writer/skills/price-monitor
编写 SKILL.md:
# 竞品价格监控技能
## 描述
监控指定电商平台上的商品价格变化。
## 触发条件
当用户说"查价格"、"价格监控"、"竞品查价"时触发。
## 执行步骤
1. 询问用户要监控的商品名称
2. 使用浏览器工具打开电商平台搜索页面
3. 搜索商品名称
4. 提取前 10 个搜索结果的标题和价格
5. 将结果整理成表格格式返回
6. 询问用户是否需要设置定时监控
## 配置
- 默认平台:京东
- 截图保存路径:~/Screenshots/price-monitor/
之后,你只需要说:帮我查一下机械键盘的竞品价格,OpenClaw 就会自动执行整个流程。
实用技巧和注意事项
提高自动化可靠性的技巧
1. 指令要具体
- ❌ 太模糊:
帮我看看那个网站 - ✅ 具体明确:
打开 https://example.com/products,找到价格低于 500 的商品,提取它们的名称、价格和评分,整理成表格
2. 处理分页
打开这个列表页,提取所有商品信息。
如果有多页,翻到最后一页,把所有页面的数据汇总。
每次翻页间隔 3 秒,避免触发反爬。
3. 错误处理
打开这个网站,如果出现验证码就截图发给我,
如果没有就直接提取页面内容
安全注意事项
- 敏感操作加确认:涉及登录、支付等操作时,让 OpenClaw 先截图确认,再执行
- 不要在群聊中暴露浏览器:浏览器中可能包含你的登录态和隐私信息
- 定期清理 Cookie:长时间运行的浏览器会积累大量 Cookie
- 使用专用 Chrome Profile:建议为 OpenClaw 创建独立的 Chrome 用户配置
节省 Token 的技巧
浏览器自动化操作会消耗较多 Token(因为需要读取页面快照)。几个省 Token 的方法:
- 精简指令:越简洁的指令,消耗越少
- 指定目标区域:只提取页面中间的商品列表部分
- 避免频繁截图:只在必要时截图
- 复用技能:把常用流程封装成 Skill,减少重复描述
常见问题
Q: 浏览器自动化支持哪些浏览器?
A: 目前主要支持 Chrome/Chromium 系浏览器。Firefox 和 Safari 暂不支持。
Q: 可以同时操作多个浏览器标签页吗?
A: 可以。OpenClaw 支持多标签管理,可以同时在不同标签页执行任务。
Q: 网页有验证码怎么办?
A: OpenClaw 会自动检测验证码,建议在指令中加上"如果遇到验证码就截图通知我"。
Q: 如何处理需要登录的网站?
A: 推荐使用 Attach Mode 接管已登录的 Chrome 浏览器,或者使用 user profile 复用登录态。
总结
OpenClaw 浏览器自动化功能,让 AI 能够真正"看懂"和"操作"网页,大大提升了网页相关任务的自动化程度。无论是数据采集、价格监控还是表单填写,都能通过自然语言指令完成。
最佳实践:建议将常用的浏览器操作流程封装成 Skill,既能节省 Token,又能提高执行效率和可靠性。