10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Nex-N2-Pro 开源模型,性能对标 GPT-5.5,专为 Agent 场景设计,限时免费

1小时前 AI最新动态 16 0

2026 年 6 月初,Nex AGI(上海创智学院联合多家机构)发布并开源了 Nex-N2-Pro 模型,基于 Qwen3.5-397B-A17B 后训练,性能对标 GPT-5.5 和 Opus 4.7,目前限时免费。

更关键的是,它不是"只会聊天"的模型——天生就是为 Agent(智能体)场景 设计的。

01 核心亮点:三大能力

1. Agentic Thinking —— 推理和行动统一

大多数模型的"思考"和"执行"是割裂的。Nex-N2-Pro 把 搜索、编码、工具调用 统一到了同一个思维框架下:目标分解 → 状态追踪 → 策略调整 → 自我校验。做复杂任务时,会自己拆解步骤、记住进度、遇到问题换策略、做完还会自检。

2. Adaptive Thinking —— 自主决定是否深度思考

它能自主判断任务难度,动态调控推理强度:

  • 简单任务:直接回答,不浪费算力
  • 复杂任务:自动开启深度推理

实测数据显示,Adaptive Thinking 在保持任务完成率的同时,token 消耗节省约 20%。

3. 全场景统一推理构型

在三类任务上展现不同推理策略:

  • 搜索任务:前期拆解搜索策略,末段综合证据
  • SWE 编程:定位 bug 阶段和验证修复阶段推理最密集
  • 开放式长程任务:推理随任务推进逐步加深,收尾时达到峰值

核心逻辑:推理总是集中在最需要决策的环节,不浪费在无关紧要的地方。

02 实测数据:和 GPT-5.5 差多少?

部分场景已经持平甚至超越,部分还有差距。

编程能力(SWE 相关)

基准 Nex-N2-Pro GPT-5.5 Opus 4.7
SWE-Bench Verified 80.8% 82.9% 87.6%
SWE-Bench Pro 58.8% 58.6% 64.3%
Terminal-Bench 2.1 75.3% 83.4% 69.7%
DeepSWE 33.6% 70% 54%

SWE-Bench Pro 上已经超越 GPT-5.5,Terminal-Bench 也超过了 Opus 4.7。

Agent 能力

基准 Nex-N2-Pro GPT-5.5 Opus 4.7
BrowseComp 83.7% 84.4% 79.8%
GDPval 1585 1769 1753
Toolathlon 51.9% 55.6% 52.8%

BrowseComp 上已经非常接近 GPT-5.5,超越 Opus 4.7 近 4 个百分点。

通用推理

GPQA Diamond 90.7%,IFEval 94.0%,已进入第一梯队。

03 实测体验:接入 OpenClaw 当 Agent

优点

  • 工具调用准确:Agentic Thinking 架构确实有效,调用 MCP 工具、执行多步骤任务时逻辑清晰
  • 响应速度快:在硅基流动平台上延迟很低,体验流畅
  • 中文能力强:基于 Qwen3.5 后训练,中文理解到位
  • 免费:目前限时免费开放 API

不足

  • 复杂推理有差距:DeepSWE 等高难度任务上和 GPT-5.5 还有明显差距
  • 创意任务一般:Agentic 能力强不等于创意好,写文章还是 GPT 系列更自然
  • 权重未完全开放:本地部署需要的显存门槛不低

适合场景

  • 代码助手 / Bug 修复
  • 信息搜索与综合
  • 自动化工作流(Agent)
  • 需要调用工具的任务

04 完整开源生态

Nex AGI 开源的不只是模型,而是完整的 AI Agent 生态:

组件 说明
Nex-N2-Pro 核心模型(开源)
NexAU 智能体开发框架(开源)
NexRL 强化学习训练框架(开源)
训练数据 7 万条能动性数据(开源)
EaaS 通信库 GPU P2P 通信组件(开源)

从模型到训练到部署,全链路开源。

05 快速接入

Nex-N2-Pro 已在 SiliconFlow(硅基流动) 平台上线,限时免费开放 API 调用:

# OpenAI 兼容接口,替换 endpoint 即可
export OPENAI_API_KEY="你的 API Key"
export OPENAI_BASE_URL="https://api.siliconflow.cn/v1"

# 直接调用
curl https://api.siliconflow.cn/v1/chat/completions \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nex-agi/Nex-N2-Pro",
    "messages": [{"role":"user","content":"你好"}]
  }'

总结

Nex-N2-Pro 的意义不只是"又一个开源模型",而是证明了:国产开源模型在 Agent 场景下,已经可以和 GPT-5.5 正面较量。SWE-Bench Pro 超越 GPT-5.5,BrowseComp 接近 GPT-5.5,全链路开源生态,限时免费可用。

相关链接:

  • HuggingFace:https://huggingface.co/nex-agi/Nex-N2-Pro
  • ModelScope:https://www.modelscope.cn/models/nex-agi/Nex-N2-Pro
  • GitHub:https://github.com/nex-agi
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Nex-N2-Pro 开源模型,性能对标 GPT-5.5,专为 Agent 场景设计,限时免费
#Nex-N2-Pro #开源模型 #Agent #GPT-5.5 #SiliconFlow 
收藏 1
AudioX-Turbo 开源音频生成模型:4 步极速出音效,支持文本/视频多模态输入
这是最后一篇
推荐阅读
  • 智谱推出 Super Z:微信、飞书直接对话 GLM-5,零配置使用大模型
  • MiniMax M2 上线:顶级代码与 Agent 能力,仅 Claude 价格的 8%
  • 教你白嫖一台腾讯云服务器:CodeBuddy × 腾讯云 Lighthouse限时福利,手慢无!
  • GPT-5 Codex 来了:比 Claude Code 更专业的编程伙伴?
  • 国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
31147 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28344 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
20023 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19718 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16217 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
16176 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15717 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14982 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14358 1年前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
14328 2月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Nex-N2-Pro 开源模型,性能对标 GPT-5.5,专为 Agent 场景设计,限时免费
2 纳德拉:未来开发者要管理 1000 个 AI Agent,编程不会死但工作方式会变
3 微信小微 AI Agent :自研 WeLM 模型、语音优先交互、个人小工具生态
4 美团 LongCat 公测:每日最高 1.2 亿 Tokens 免费额度,1M 上下文窗口
5 GLM-5.2 实测评估:DeepSeek 之上的复杂执行层模型,海外社区真实反馈
6 Fable 5 暂停事件反思:AI 编程生产体系如何构建可替换的模型节点
7 GLM 5.2 开源详览:1M 上下文、744B MoE 架构与 Coding 实测
8 SpaceX 600 亿美元收购 Cursor:马斯克买下 AI 编程入口
9 GLM-5.2 开源:1M 上下文、744B MoE 与工程化突破
10 Kimi K2.7 Code 高速版实测:4 个工程任务验证,适合进工作流的 coding agent
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联