OpenAI 的 Operator、Claude 的 Computer Use 确实惊艳——AI 像真人一样操作电脑,点击、输入、刷网页、整理文件。但按 Token 计费的模式让很多普通用户望而却步,企业级应用更是成本压力巨大。
有没有一种方案,既能像真人一样操作电脑,又完全免费、数据不出本地?法国 AI 公司发布的 Holo 3.1 配合开源框架 OpenClaw,把这件事变成了现实——只要一张消费级显卡(4GB-24GB 显存),就能在本地实现"Token 自由"。
为什么选择 Holo 3.1
Holo 3.1 是专门为"电脑操作(Computer Use)"场景训练的 Agent 模型,相比通用大语言模型,优势很集中:
- 深度视觉理解:不只是"看懂"屏幕,还能完成点击、输入、导航等复杂交互
- 本地化部署:可对接 OpenClaw、Hermes 等主流 Agent 框架,数据完全不出本地
- 零成本:不订阅、不计费,有显卡就能一直跑
苏米注:Holo 3.1 的核心价值在于把 Computer Use 的门槛从"企业级"降到了"个人级"。4GB 显存就能跑,意味着大多数有独立显卡的 PC 都可以本地部署。
实战部署:四步搭建本地 Agent
第一步:下载 llama.cpp
llama.cpp 作为底层推理引擎,先去下载最新版本:
- N 卡用户:下载 CUDA 版本
- A 卡用户:下载 Vulkan 或 HIP 版本
解压后,在根目录下新建一个名为 models 的文件夹。
第二步:下载模型
根据显存大小选择合适的 GGUF 格式模型:
| 显存档位 | 推荐模型 |
|---|---|
| 入门级 | 0.8B / 4B |
| 进阶级 | 9B |
| 旗舰级(24GB 显存) | 35B(Q4_K_M) |
⚠️ 注意:除了主模型,还要下载一个以 MM 开头的视觉模型(约 800MB),两者一并放进 models 文件夹——少了它,模型就看不懂屏幕内容。
第三步:启动本地服务
在 llama.cpp 根目录新建一个 启动.bat 批处理文件(确保保存为 UTF-8 编码),写入启动脚本后运行,根据显存大小选择对应的启动模式。
启动成功后,会得到一个本地访问地址,通常是:
http://127.0.0.1:1234
第四步:对接 OpenClaw
OpenClaw 是让模型真正能"操控电脑"的大脑。按以下步骤配置:
- 以管理员身份打开 PowerShell,安装 OpenClaw
- 输入
openclaw onboard进行初始化 - 服务提供商选择 Custom(自定义)
- API 地址填写
http://127.0.0.1:1234/v1 - API Key 留空,模型 ID 填写下载的 GGUF 文件全名
- 提示是否支持图片输入时,选择 Yes
它到底能为你做什么
场景一:全自动办公
打开浏览器,进入博客后台,自己拟标题、写正文、点击发布——全程不用人插手,跟真人操作一模一样。
场景二:深度市场调研
下一个指令,它就能自动搜索不同 AI 产品的价格、上下文长度、适用人群,整理成一份对比表格。遇到浏览器弹出的安全验证,它也能自动识别处理。
场景三:资源搜集与整理
- 自动比价:在亚马逊搜索特定价格区间、高评分的商品,列出前三名商家
- 文件处理:搜索最新科技资讯,总结要点,自动在桌面生成 .txt 总结文档
- 多媒体下载:打开网页,把指定图片下载保存到本地桌面
总结
Holo 3.1 的出现,标志着本地 AI Agent 已经进入"高可用"阶段——即使是 35B 这样的大模型,本地运行依然流畅。
苏米注:对于关注数据隐私和成本控制的用户来说,本地部署的 Computer Use Agent 是比云端方案更务实的选择。4GB 显存的门槛也让它比 Claude Computer Use 亲民得多。