10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Holo3.1开源Computer Use模型发布:35B版性能超越Qwen3.5、Claude Sonnet 4.6

1周前 AI最新动态 439 0

6 月 2 日,法国 AI 公司 H Company 推出 Holo3.1 系列开源计算机控制大模型。这是继两个月前 Holo3 发布后,该团队针对生产环境反馈优化的版本,核心解决此前计算机控制 AI 代理(Computer-use Agent)普遍存在的云部署延迟高、成本高、数据隐私风险的问题。

Holo3.1 是什么?

Holo3.1 基于 Qwen 架构开发,专门针对 GUI 理解、屏幕操作、任务规划、跨应用导航等计算机控制场景做了微调。和通用大模型相比,在真实本地 GUI 任务中的表现更突出。同时原生支持函数调用协议,可无缝接入第三方 AI 代理框架,适配不同生产环境的部署需求。

整个系列覆盖 0.8B、4B、9B、35B 四种参数规格,提供 NVFP4、FP8、Q4 GGUF 三种量化版本,可完全离线运行在 MacBook、Windows PC、DGX Spark 等设备上,所有运算与数据均不离开用户本地环境。

图片 1

性能表现:35B 版全面超越主流模型

官方给出的基准测试数据显示,Holo3.1 35B 版本整体性能达 78.3%,OSWorld 基准 80.0%,AndroidWorld 基准 79.3%,全面超过 Qwen3.5-397B、Kimi-K2.5、Claude Sonnet 4.6 等主流模型。

图片 2

哪怕是 4B、9B 的小参数版本,AndroidWorld 基准成绩也达到 71%,足够覆盖多数简单自动化场景。

速度优化:NVFP4 量化提升显著

在 DGX Spark 设备上使用 Fast harness 调度,NVFP4 量化的 35B 版本每分钟可处理 18.1 个请求:

  • 是 FP8 版本的 1.5 倍
  • 是全精度 BF16 版本的 1.74 倍
  • OSWorld 基准成绩仅比 BF16 版本低 2 个百分点,几乎无感知损失

图片 3

图片 4

苏米注:NVFP4 量化的效果非常值得关注——1.74 倍的速度提升,精度损失仅 2 个百分点。这意味着在本地部署 Computer Use模型时,可以在性能和精度之间找到很好的平衡点。

本地部署:消费级硬件即可运行

Q4 GGUF 版本的 35B 模型可在苹果硅 Mac、普通 Windows PC 上运行,小参数版本甚至有望适配移动端神经引擎。官方提到,配合后续将推出的桌面代理调度工具,端到端操作延迟可从 6.8 秒压缩到 3.3 秒。

开源协议与 API 服务

目前所有 Holo3.1 模型权重已在 Hugging Face 开放下载:

  • 35B 版本:Apache 2.0 协议完全开源,可免费商用
  • 122B 版本:研究授权,仅对付费用户开放,适用于复杂多步操作场景

官方同时提供 API 服务:

  • 免费 tier:每分钟 10 次请求,无需绑定信用卡
  • 付费版:输入 token $0.25/百万,输出 token $1.8/百万,上下文长度 65536
  • 支持最多 5 张 1080P 图像输入
  • API 默认不保留用户的提示词与返回结果,仅记录请求时间、模型与 token 数量等基础日志

开发者社区反馈

该模型发布后引发开发者社区关注。有开发者提到,此前云端代理的延迟和成本足以抵消多数自动化收益,本地高吞吐量的计算机控制模型才是 AI 代理真正进入日常工作的核心前提。也有开发者表示,4B 小参数版本的表现超出预期,有望在端侧设备上实现可用的 AI 操作功能。

相关链接

  • 官方技术博客:hcompany.ai/holo3.1
  • Holo 模型 API:hcompany.ai/holo-models-api
  • Hugging Face 下载:huggingface.co/collections/Hcompany/holo31

总结:Holo3.1 的核心价值在于将 Computer Use 能力从云端拉到本地——35B 版性能超越多个主流闭源模型,同时支持在消费级硬件上离线运行。Apache 2.0 开源协议 + 免费 API tier,降低了开发者的试用门槛。对于关注本地 AI 代理和端侧部署的开发者来说,这是一个值得密切跟进的项目。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Holo3.1开源Computer Use模型发布:35B版性能超越Qwen3.5、Claude Sonnet 4.6
#Holo3.1 #Computer Use #开源模型 #AI新闻 #本地部署 
收藏 1
Qwen3.7-Plus正式发布:多模态冲进Vision Arena全球前五
OpenCode Zen 免费模型快速接入Claude Code 使用实操教程指南
推荐阅读
  • Step 3.7 Flash:10 秒生成千行代码,生产级 Agent 的高效率之选
  • DeepSeek 官方Github开源及DeepSeek相关Github开源项目合集
  • 卖 API 不够用了:Anthropic 和 OpenAI 同日设立合资公司,把工程师直接派进企业
  • Gemini 2.5 Pro再升级:推出专用计算机操作模型,智能体开始真正接管电脑操作
  • 谷歌出手:Gemini 上线 Lyria 3,7.5 亿人“拍照出歌”,可免费体验
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30982 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28173 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
19758 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19557 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16136 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
16039 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15591 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14885 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14284 1年前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
13779 2月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 4 个免费 Token 渠道全攻略:两个月没花一分钱
2 ZCode 3.0 + GLM-5.2 深度评测:国产 AI 编程工具的最佳组合
3 Kimi K2.7 Code 模型发布:长程编程 token 消耗降 30%,6 倍速高速版即将上线
4 OpenCode 发布大模型调用数据报告:DeepSeek 用量第一,Qwen 缓存命中率 98%
5 GLM-5.2 发布:1M 上下文 + 全量开放,国产 Coding 模型新标杆
6 Claude Fable 5 全球下线始末,当安全叙事成为监管利器
7 Claude Fable 5 vs GPT-5.5 实测对比,2026 年编程 AI 选型指南
8 小米开源 MiMoCode,5 人 14 天打造的 AI 编程 Agent,支持跨会话记忆与多 Agent 协作
9 Google Gemini 3.5 Live Translate:70+语言实时同声翻译模型发布
10 火山方舟Coding Plan 和 Agent Plan 系列套餐 618特惠9.9元起,旗舰模型19元购
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联