10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

Web Access Skill:Claude Code 必备神级外挂,支持登录态操作和并行网站处理

2小时前 AI开源项目 12 0

我发现Claude Code虽然自带了基础的联网功能,但在实际应用中存在明显的局限性——缺乏调度策略、无法处理动态内容、对需要登录态的页面更是无能为力。

直到接触到Web Access这个开源项目,我意识到这正是填补Claude Code能力空白的关键工具。今天就来详细介绍一下这个项目的核心能力和实际应用价值。

项目概览

Web Access是一个为Claude Code设计的浏览器自动化扩展插件,核心定位是为AI Agent提供完整的网页交互能力。

相比Claude Code原生的联网工具,Web Access通过引入三层通道调度机制和CDP浏览器协议直连,使AI能够像真实用户一样浏览网页、填写表单、上传文件,甚至处理需要登录认证的复杂场景。

项目目前在GitHub上获得了2.1k Stars和168个Forks,采用MIT开源协议,作者为eze-is,最新版本为v2.4。

核心功能分析

1. 联网工具智能选择

Web Access内置了多种网页获取方案,能够根据不同场景自动判断最优工具:

  • 静态页面优先使用Jina等轻量级方案
  • 动态内容切换到CDP Proxy进行浏览器操作
  • 特定场景则调用专有工具处理

这种自适应机制避免了"一把锤子敲所有钉子"的低效做法。

2. Chrome DevTools Protocol(CDP)代理层

这是Web Access的技术核心。它通过WebSocket直接连接到本地Chrome浏览器,无需复杂的命令行配置,即可通过HTTP API进行页面操作。支持的操作包括:

  • 新建标签页:curl -s "http://localhost:3456/new?url=https://example.com"
  • JavaScript执行:curl -s -X POST "http://localhost:3456/eval?target=ID" -d 'document.title'
  • 点击操作:支持模拟点击(click)和真实鼠标事件(clickAt)
  • 文件上传:curl -s -X POST "http://localhost:3456/setFiles?target=ID" -d '{"selector":"input[type=file]","files":["/path/to/file.png"]}'
  • 页面截图与滚动:curl -s "http://localhost:3456/screenshot?target=ID&file=/tmp/shot.png"
  • 标签页管理:关闭、切换等操作

这套API设计相对简洁,降低了AI Agent的调用成本。

3. 并行任务分治

当需要同时处理多个目标网站时,Web Access可以创建多个子Agent并行执行。这些子Agent共享同一个CDP Proxy,但在标签页级别完全隔离。实际应用中,可以让AI同时调研5个竞品官网并生成对比分析,系统会自动创建5个并行子任务,最后汇总结果。

4. 站点经验积累机制

Web Access按域名存储操作经验,包括:

  • URL结构规律和路由模式
  • 特定HTTP Header或Cookie需求
  • 页面加载特性(如需要滚动才能加载完整内容的陷阱)
  • 站点特有的交互逻辑

这些经验可以跨Session复用,避免重复踩坑。特别是对于频繁访问的网站,经验库会不断积累,提高后续操作的成功率。

5. 媒体提取能力

支持从DOM直接提取图片和视频URL,或对视频的任意时间点进行截帧分析,适合需要进行视觉内容处理的场景。

6. 站点特化处理

项目对小红书等重点站点做了深度优化,包括xsec_token机制处理、创作者平台状态校验和暂存草稿流程等,这些细节大幅提升了实际应用的可靠性。

安装与部署

环境要求:

  • Node.js版本22及以上
  • Chrome浏览器已启用远程调试

启用Chrome远程调试:

在Chrome地址栏打开 chrome://inspect/#remote-debugging,勾选"Allow remote debugging for this browser instance",必要时重启浏览器。

环境检查:

bash ~/.claude/skills/web-access/scripts/check-deps.sh

安装方式有两种:

方式一(自动安装):
在Claude中输入:帮我安装这个 skill:https://github.com/eze-is/web-access

方式二(手动安装):
git clone https://github.com/eze-is/web-access ~/.claude/skills/web-access

启动CDP Proxy服务:

node ~/.claude/skills/web-access/scripts/cdp-proxy.mjs &

典型应用场景

场景一:信息搜索与汇总

用户:帮我搜索最近AI Agent的进展
系统:自动选择WebSearch工具检索信息,并生成结构化总结

场景二:页面内容阅读

用户:读一下这个页面的内容:https://example.com/article
系统:选择合适的工具获取完整内容并进行摘要

场景三:需要登录态的操作

用户:去小红书搜索某账号并提取其内容
系统:使用CDP Proxy打开携带用户登录态的Chrome,执行搜索、提取数据

场景四:自动化内容发布

用户:帮我在创作者平台发布一篇图文
系统:操作浏览器登录平台、上传图片、编辑内容、完成发布流程

场景五:并行竞品分析

用户:同时访问这5个竞品官网并给出对比分析
系统:并行创建5个子任务,各自访问目标网站、提取关键信息、最后进行对比输出

与同类项目的对比

目前市场上也有其他网页自动化解决方案,如Playwright、Puppeteer等。但Web Access的差异化在于:

维度 Web Access Playwright Puppeteer
集成度 原生集成Claude Code 需要单独开发集成 需要单独开发集成
学习曲线 AI自动调度,无需手动编程 需要编写脚本 需要编写脚本
登录态处理 直连本地Chrome,天然支持 需要手动cookie配置 需要手动cookie配置
并行调度 内置并行分治机制 需要自行实现 需要自行实现
经验复用 内置站点经验积累 无 无

设计理念

Web Access背后的核心哲学是"目标驱动而非步骤驱动"。项目不是简单地提供一本操作手册,而是通过清晰的决策逻辑,把选择权交给AI Agent:

  • 优先级速度?使用轻量级方案
  • 需要动态交互?切换到CDP Proxy
  • 多个任务堆积?自动并行处理

这种设计使得系统在面对未知场景时,仍能保持相对的灵活性和自适应能力。

总结

Web Access本质上不是简单的工具堆砌,而是一套针对Claude Code的系统性增强方案。它通过调度策略、浏览器直连、经验积累等多个维度,让AI Agent能够处理真实网络环境中的复杂场景——从简单的页面爬取到复杂的登录态操作,从单网站处理到多网站并行分析。

特别值得关注的是其"站点经验积累"设计,这种跨Session的知识复用机制在同类产品中并不常见,代表了一种更务实的工程思路。

如果你正在使用Claude Code进行网页自动化工作,这个项目值得深入体验。

项目地址:https://github.com/eze-is/web-access

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Web Access Skill:Claude Code 必备神级外挂,支持登录态操作和并行网站处理
#Web Access #Claude Code 
收藏 1
OpenClaw 发布新命令 /btw:随时插话提问,主任务不受扰
HolyClaude:一条命令启动的容器化AI编程工作站,打开浏览器,就能开始写代码。
推荐阅读
  • Agent Reach:让 AI 智能体一键获得互联网访问能力
  • wechat-chatgpt:快速把国内外主流大模型无缝接入微信生态
  • MAI-UI:阿里开源的GUI智能体,让大模型真正学会操作手机
  • Agent-Browser:为 AI Agents 优化的浏览器自动化CLI方案,减少 93% 上下文,强!
  • Claude-Cowork:开源如何打破官方生态的围墙,桌面 AI 助手的平民化方案
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
8550 5月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
7350 6月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
5573 3月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
5142 1月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5088 7月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5027 5月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
4944 6月前
SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
4792 5月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
4652 6月前
Fogsight (雾象):一句话自动生成任何科普动画
4156 5月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Web Access Skill:Claude Code 必备神级外挂,支持登录态操作和并行网站处理
2 Gstack:如何让单人完成整个团队的工作量,Claude Code 变身虚拟工程团队
3 Nexu:将 AI Agent 接入即时通讯的开源桌面客户端
4 DeerFlow 2.0:近期霸榜 GitHub 的超级 AI 员工,字节开源的执行型Agent框架
5 Ruto-GLM:在手机上实现后台全自动化的 AI 助手,无需电脑的 Android 自动化解决方案
6 Agent Reach:让 AI 智能体一键获得互联网访问能力
7 5个GitHub离谱Openclaw skills:从职场PUA到赛博皇帝的演进
8 Superpowers:用系统化流程让 AI 编码代理更懂你的需求,这套 Superpowers 值得装
9 xiaohu-wechat-format:一句话搞定公众号排版、封面生成、发布的Skills
10 AionUi:20多个AI命令行编程工具的统一图形界面,19.2K Star的开源替代方案
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联