当前位置：首页 » AI最新动态

Nex-N2-Pro 开源模型，性能对标 GPT-5.5，专为 Agent 场景设计，限时免费

1小时前 AI最新动态 16 0

2026 年 6 月初，Nex AGI（上海创智学院联合多家机构）发布并开源了 Nex-N2-Pro 模型，基于 Qwen3.5-397B-A17B 后训练，性能对标 GPT-5.5 和 Opus 4.7，目前限时免费。

更关键的是，它不是"只会聊天"的模型——天生就是为 Agent（智能体）场景 设计的。

01 核心亮点：三大能力

1. Agentic Thinking —— 推理和行动统一

大多数模型的"思考"和"执行"是割裂的。Nex-N2-Pro 把 搜索、编码、工具调用 统一到了同一个思维框架下：目标分解 → 状态追踪 → 策略调整 → 自我校验。做复杂任务时，会自己拆解步骤、记住进度、遇到问题换策略、做完还会自检。

2. Adaptive Thinking —— 自主决定是否深度思考

它能自主判断任务难度，动态调控推理强度：

简单任务：直接回答，不浪费算力
复杂任务：自动开启深度推理

实测数据显示，Adaptive Thinking 在保持任务完成率的同时，token 消耗节省约 20%。

3. 全场景统一推理构型

在三类任务上展现不同推理策略：

搜索任务：前期拆解搜索策略，末段综合证据
SWE 编程：定位 bug 阶段和验证修复阶段推理最密集
开放式长程任务：推理随任务推进逐步加深，收尾时达到峰值

核心逻辑：推理总是集中在最需要决策的环节，不浪费在无关紧要的地方。

02 实测数据：和 GPT-5.5 差多少？

部分场景已经持平甚至超越，部分还有差距。

编程能力（SWE 相关）

基准	Nex-N2-Pro	GPT-5.5	Opus 4.7
SWE-Bench Verified	80.8%	82.9%	87.6%
SWE-Bench Pro	58.8%	58.6%	64.3%
Terminal-Bench 2.1	75.3%	83.4%	69.7%
DeepSWE	33.6%	70%	54%

SWE-Bench Pro 上已经超越 GPT-5.5，Terminal-Bench 也超过了 Opus 4.7。

Agent 能力

基准	Nex-N2-Pro	GPT-5.5	Opus 4.7
BrowseComp	83.7%	84.4%	79.8%
GDPval	1585	1769	1753
Toolathlon	51.9%	55.6%	52.8%

BrowseComp 上已经非常接近 GPT-5.5，超越 Opus 4.7 近 4 个百分点。

通用推理

GPQA Diamond 90.7%，IFEval 94.0%，已进入第一梯队。

03 实测体验：接入 OpenClaw 当 Agent

优点

工具调用准确：Agentic Thinking 架构确实有效，调用 MCP 工具、执行多步骤任务时逻辑清晰
响应速度快：在硅基流动平台上延迟很低，体验流畅
中文能力强：基于 Qwen3.5 后训练，中文理解到位
免费：目前限时免费开放 API

不足

复杂推理有差距：DeepSWE 等高难度任务上和 GPT-5.5 还有明显差距
创意任务一般：Agentic 能力强不等于创意好，写文章还是 GPT 系列更自然
权重未完全开放：本地部署需要的显存门槛不低

适合场景

代码助手 / Bug 修复
信息搜索与综合
自动化工作流（Agent）
需要调用工具的任务

04 完整开源生态

Nex AGI 开源的不只是模型，而是完整的 AI Agent 生态：

组件	说明
Nex-N2-Pro	核心模型（开源）
NexAU	智能体开发框架（开源）
NexRL	强化学习训练框架（开源）
训练数据	7 万条能动性数据（开源）
EaaS 通信库	GPU P2P 通信组件（开源）

从模型到训练到部署，全链路开源。

05 快速接入

Nex-N2-Pro 已在 SiliconFlow（硅基流动） 平台上线，限时免费开放 API 调用：

# OpenAI 兼容接口，替换 endpoint 即可
export OPENAI_API_KEY="你的 API Key"
export OPENAI_BASE_URL="https://api.siliconflow.cn/v1"

# 直接调用
curl https://api.siliconflow.cn/v1/chat/completions \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nex-agi/Nex-N2-Pro",
    "messages": [{"role":"user","content":"你好"}]
  }'

总结

Nex-N2-Pro 的意义不只是"又一个开源模型"，而是证明了：国产开源模型在 Agent 场景下，已经可以和 GPT-5.5 正面较量。SWE-Bench Pro 超越 GPT-5.5，BrowseComp 接近 GPT-5.5，全链路开源生态，限时免费可用。