10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Holo3.1开源Computer Use模型发布:35B版性能超越Qwen3.5、Claude Sonnet 4.6

2小时前 AI最新动态 25 0

6 月 2 日,法国 AI 公司 H Company 推出 Holo3.1 系列开源计算机控制大模型。这是继两个月前 Holo3 发布后,该团队针对生产环境反馈优化的版本,核心解决此前计算机控制 AI 代理(Computer-use Agent)普遍存在的云部署延迟高、成本高、数据隐私风险的问题。

Holo3.1 是什么?

Holo3.1 基于 Qwen 架构开发,专门针对 GUI 理解、屏幕操作、任务规划、跨应用导航等计算机控制场景做了微调。和通用大模型相比,在真实本地 GUI 任务中的表现更突出。同时原生支持函数调用协议,可无缝接入第三方 AI 代理框架,适配不同生产环境的部署需求。

整个系列覆盖 0.8B、4B、9B、35B 四种参数规格,提供 NVFP4、FP8、Q4 GGUF 三种量化版本,可完全离线运行在 MacBook、Windows PC、DGX Spark 等设备上,所有运算与数据均不离开用户本地环境。

图片 1

性能表现:35B 版全面超越主流模型

官方给出的基准测试数据显示,Holo3.1 35B 版本整体性能达 78.3%,OSWorld 基准 80.0%,AndroidWorld 基准 79.3%,全面超过 Qwen3.5-397B、Kimi-K2.5、Claude Sonnet 4.6 等主流模型。

图片 2

哪怕是 4B、9B 的小参数版本,AndroidWorld 基准成绩也达到 71%,足够覆盖多数简单自动化场景。

速度优化:NVFP4 量化提升显著

在 DGX Spark 设备上使用 Fast harness 调度,NVFP4 量化的 35B 版本每分钟可处理 18.1 个请求:

  • 是 FP8 版本的 1.5 倍
  • 是全精度 BF16 版本的 1.74 倍
  • OSWorld 基准成绩仅比 BF16 版本低 2 个百分点,几乎无感知损失

图片 3

图片 4

苏米注:NVFP4 量化的效果非常值得关注——1.74 倍的速度提升,精度损失仅 2 个百分点。这意味着在本地部署 Computer Use模型时,可以在性能和精度之间找到很好的平衡点。

本地部署:消费级硬件即可运行

Q4 GGUF 版本的 35B 模型可在苹果硅 Mac、普通 Windows PC 上运行,小参数版本甚至有望适配移动端神经引擎。官方提到,配合后续将推出的桌面代理调度工具,端到端操作延迟可从 6.8 秒压缩到 3.3 秒。

开源协议与 API 服务

目前所有 Holo3.1 模型权重已在 Hugging Face 开放下载:

  • 35B 版本:Apache 2.0 协议完全开源,可免费商用
  • 122B 版本:研究授权,仅对付费用户开放,适用于复杂多步操作场景

官方同时提供 API 服务:

  • 免费 tier:每分钟 10 次请求,无需绑定信用卡
  • 付费版:输入 token $0.25/百万,输出 token $1.8/百万,上下文长度 65536
  • 支持最多 5 张 1080P 图像输入
  • API 默认不保留用户的提示词与返回结果,仅记录请求时间、模型与 token 数量等基础日志

开发者社区反馈

该模型发布后引发开发者社区关注。有开发者提到,此前云端代理的延迟和成本足以抵消多数自动化收益,本地高吞吐量的计算机控制模型才是 AI 代理真正进入日常工作的核心前提。也有开发者表示,4B 小参数版本的表现超出预期,有望在端侧设备上实现可用的 AI 操作功能。

相关链接

  • 官方技术博客:hcompany.ai/holo3.1
  • Holo 模型 API:hcompany.ai/holo-models-api
  • Hugging Face 下载:huggingface.co/collections/Hcompany/holo31

总结:Holo3.1 的核心价值在于将 Computer Use 能力从云端拉到本地——35B 版性能超越多个主流闭源模型,同时支持在消费级硬件上离线运行。Apache 2.0 开源协议 + 免费 API tier,降低了开发者的试用门槛。对于关注本地 AI 代理和端侧部署的开发者来说,这是一个值得密切跟进的项目。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Holo3.1开源Computer Use模型发布:35B版性能超越Qwen3.5、Claude Sonnet 4.6
#Holo3.1 #Computer Use #开源模型 #AI新闻 #本地部署 
收藏 1
Qwen3.7-Plus正式发布:多模态冲进Vision Arena全球前五
这是最后一篇
推荐阅读
  • DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
  • 教你白嫖一台腾讯云服务器:CodeBuddy × 腾讯云 Lighthouse限时福利,手慢无!
  • Claude工具目录深度体验:MCP协议如何让AI助手变身"万能插座"
  • 刚刚,Codex Windows 版上线:现可免费体验
  • Gemma 4 + TurboQuant:Google开源模型新方案,本地部署 LLM 内存降低 83%
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30501 10月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
27569 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19034 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
19027 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15901 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
15540 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15116 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14585 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14086 1年前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
12364 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Holo3.1开源Computer Use模型发布:35B版性能超越Qwen3.5、Claude Sonnet 4.6
2 Qwen3.7-Plus正式发布:多模态冲进Vision Arena全球前五
3 Hermes Desktop 正式发布:Hermes Agent 变身桌面端 Codex 竞争者
4 OpenAI Codex三大重磅更新:角色插件、Sites 网站生成、精准批注
5 Composer 2.5 上线 Grok CLI:SpaceX 算力加持,Cursor 编码模型正式接入
6 豆包即将收费:价格体系、服务分层与底层商业逻辑分析
7 华人团队主导AI推理平台Fireworks AI 估值暴涨27倍至150亿美元
8 Agnes AI 全模态 API 无限期免费:文本、图像、视频模型实测与接入指南
9 MiniMax M3 即将发布:MSA 稀疏注意力重构大模型效率
10 MiniMax-M2.7 模型在 OpenHands Agent 平台上免费使用
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联