10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

Browser Harness 开源:592 行代码实现自愈式浏览器自动化,3.2K Star

6小时前 AI开源项目 33 0

从去年开始,AI Agent 火得一塌糊涂。从 AutoGPT 到各种浏览器自动化工具,大家都在做同一件事:让 AI 替人类操作网页。

但用过这类工具的人都知道,现实远比想象骨感。传统的浏览器自动化,本质上是在"教 AI 用人类的方式上网"——开发者预先写好一堆工具函数,定义好每一步该点哪里、填什么。AI 只是一个执行者,按部就班地调用这些预设好的能力。

这种模式有个致命缺陷:互联网是活的。网页每天都在变,新的交互形式层出不穷。预置的工具函数永远追不上现实世界的复杂度。

就在前几天,GitHub 明星项目 Browser Use(GitHub 上 88k+ Star 的浏览器自动化框架)团队,扔出了一个堪称"反常识"的实验性项目——Browser Harness。

Browser Harness 项目

他们没有选择继续堆功能、加适配,而是做了一件极其大胆的事:

把控制权完全交给 AI,让 Agent 自己在任务过程中写代码、补功能、沉淀经验。

整个项目只有 592 行 Python 代码。没有框架,没有预设流程,没有复杂配置。就是一根 WebSocket 直连 Chrome,然后让 AI 自己发挥。

开源没几天就已经收获了 3.2K Star,反响剧烈!

项目简介

Browser Harness 是 Browser Use 团队开源的一个实验性项目,定位为"最简单、最轻量、自愈式的浏览器控制工具"。

与传统的浏览器自动化工具不同,Browser Harness 不依赖任何中间框架,也不需要开发者预先写好流程模板。它直接通过 WebSocket 连接 Chrome 浏览器,整个核心代码只有区区 592 行 Python 代码。

这个项目的特点可以用三个"无"来概括:

  • 无框架:没有复杂的抽象层,直接基于 Chrome DevTools Protocol (CDP)
  • 无预设:没有固定的流程模板,AI 完全自主决定如何完成任务
  • 无约束:没有限制性的"护栏",AI 可以自由探索和尝试

这种极简的设计理念,让 Browser Harness 展现出了惊人的灵活性和强大的自愈能力。

核心亮点

1. 实时补充功能,边做边写

Browser Harness 最令人惊叹的特性是它允许 AI 在任务执行过程中实时编写缺失的功能。这个过程完全自动进行,不需要人工干预。AI 会根据任务需求,当场补充需要的功能,真正做到了"遇到问题,解决问题"。

2. 自动沉淀技能,越用越聪明

除了实时编写功能,Browser Harness 还能自动将学到的操作路径沉淀为技能文件。

当 AI 完成一个任务后,它会总结这次任务中学到的经验,包括:

  • 网站的选择器
  • 操作流程
  • 边界情况处理

这些经验会被保存到 domain-skills/ 目录下,下次遇到同类网站或任务时,AI 就可以直接复用这些技能,无需重新摸索。

项目中已经内置了一些现成的技能文件,包括 GitHub、LinkedIn、Amazon 等常见网站,你可以直接参考使用。

3. 即插即用,适配主流 AI 工具

Browser Harness 的设计非常友好,可以直接适配 Claude Code 和 Codex 等主流 AI 编程工具。

你只需要按照项目提供的 setup prompt 粘贴到 Claude Code 或 Codex 中,AI 就会帮你完成安装和配置,然后就可以开始使用了。

技术架构

Browser Harness 的代码结构极其精简,整个项目只有几个核心文件:

文件 行数 功能
install.md - 首次安装和浏览器引导文档
SKILL.md - 日常使用说明
run.py ~36 行 预加载 helpers 的纯 Python 运行脚本
helpers.py ~195 行 初始工具调用集合,AI 会编辑这些
admin.py + daemon.py ~361 行 守护进程引导 + CDP WebSocket 和套接字桥接

总计:592 行 Python 代码!

这就是 Browser Harness 全部的核心代码。没有复杂的依赖,没有层层封装,一切都尽可能保持简单和透明。

技术栈

Browser Harness 直接基于 Chrome DevTools Protocol (CDP) 构建,通过一个 WebSocket 连接直接与 Chrome 浏览器通信,中间没有任何额外的框架层。

这种架构带来了几个显著的优势:

  • 高性能:没有中间层的开销,通信延迟极低
  • 透明:可以直接看到和控制所有浏览器操作
  • 灵活:不受框架限制,可以实现任何浏览器功能
  • 轻量:代码量极小,易于理解和修改

快速上手

Browser Harness 的安装非常简单,主要步骤如下:

  1. 阅读 install.md:首先阅读项目中的 install.md 文件,了解如何安装和连接浏览器
  2. 阅读 SKILL.md:然后阅读 SKILL.md 了解日常使用方法
  3. 阅读 helpers.py:务必阅读 helpers.py,因为这是函数存放的地方
  4. 粘贴 setup prompt:将项目提供的 setup prompt 粘贴到 Claude Code 或 Codex 中
  5. 完成配置:AI 会帮你完成剩余的安装和配置工作

项目还提供了免费的远程浏览器服务,非常适合子代理或部署场景:

  • 免费套餐:3 个并发浏览器
  • 可以在 cloud.browser-use.com/new-api-key 获取 API Key
  • 也可以让 AI 通过 docs.browser-use.com/llms.txt 自行注册

总结

Browser Harness 用 592 行代码向我们展示了一个全新的浏览器自动化范式。

它不是另一个 Selenium 或 Playwright,而是一个完全不同的思路:

  • 极简:没有复杂的框架,直接连接浏览器
  • 自愈:AI 可以实时编写缺失的功能
  • 学习:自动沉淀经验,越用越聪明
  • 自由:给 AI 完全的自主权,没有预设约束

苏米注:Browser Harness 的设计理念非常值得借鉴——把控制权交给 AI,让它自己在实践中学习和成长。这种"自愈式"的架构解决了传统浏览器自动化工具的最大痛点:无法应对网页变化。592 行代码就能实现如此强大的功能,说明极简设计 +AI 自主性可以产生惊人的效果。对于需要浏览器自动化的开发者来说,这个项目值得一试。

 

GitHub:https://github.com/browser-use/browser-harness

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Browser Harness 开源:592 行代码实现自愈式浏览器自动化,3.2K Star
#Browser Harness #浏览器自动化 #开源项目 #AI Agent #CDP 
收藏 1
Hermes Agent 的 7 个隐藏黑科技:会自我进化的 AI 助手完整使用指南
这是最后一篇
推荐阅读
  • 5个GitHub离谱Openclaw skills:从职场PUA到赛博皇帝的演进
  • OpenDataLoader PDF 开源项目:PDF 解析精度 0.90 领先同类,支持本地/Hybrid 双模式
  • RuoYi AI | 一款基于 RuoYi 框架开发的AI平台,支持本地化 AI 能力,包括向量检索、知识图谱、数字人交互,AI 流程编排
  • DooTask:开源任务管理新选择,探索高效能与便捷性
  • Dyad:本地优先的全栈应用生成器,无需云端的 AI Builder 替代方案
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
8884 6月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
7938 7月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
6061 3月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
5651 2月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
5416 7月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5292 7月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5174 6月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
5171 7月前
SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
5015 6月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
4777 6月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Browser Harness 开源:592 行代码实现自愈式浏览器自动化,3.2K Star
2 Hermes Desktop v0.5.0 发布:原生 macOS 桌面伴侣,SSH 直连无网关
3 video-use 开源:Claude Code 自动视频剪辑 Skill,双层架构大幅降低 Token 消耗
4 Learn Claude Code 开源:真正的 Agent Harness 工程实战,12 课程从零构建 AI 智能体
5 说人话 Skill 详解:如何去除 AI 生成内容的翻译腔和工程师腔
6 Google TimesFM 开源详解:1000 亿时间点预训练,零样本时间序列预测模型
7 Claude Code 生成专业图表的 15 个 Skills:覆盖 7 种渲染引擎的完整指南
8 web-access Skill 全解析:让 AI 像真人一样浏览网页的联网操作工具
9 Hermes Web UI 汉化版发布:8 平台统一管理的 AI 对话控制台
10 5个Claude Skill覆盖你的可视化全场景,用文字直接生成图表
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联