10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

英伟达CES 2026 发布下一代 AI 计算平台 Rubin:六芯片协同设计,AI算力与能效迎来十倍跃迁

23小时前 AI最新动态 42 0

 

英伟达在 CES 2026 发布了下一代 AI 计算平台 Rubin,Rubin 平台彻底刷新了我对“AI基础设施”的认知。它不再只是单颗GPU的升级,而是一整套从CPU、GPU到网络、存储、互联的极端协同设计(Extreme Codesign),目标只有一个:

让训练和推理大模型的成本与功耗真正进入可规模化的新阶段。

六款芯片齐发:把整个机架当作一台电脑来设计

英伟达这次一口气发布了六款全新芯片,共同构成 Rubin AI 计算平台:
  • Vera CPU:自研 CPU,88 个定制 Olympus 核心
  • Rubin GPU:下一代 GPU,集成 3360 亿晶体管
  • NVLink 6 Switch:实现机架内 GPU 互联,每 GPU 带宽达 3.6TB/s
  • ConnectX-9 SuperNIC:800Gb/s 高速网卡
  • BlueField-4 DPU:专责安全、存储与基础设施卸载
  • Spectrum-6 Ethernet Switch:机架间互联,单芯片带宽 102.4Tb/s
黄仁勋在发布会上直言:“Rubin 来得正是时候,AI 计算需求正在爆炸。” 这句话背后,是真实世界中模型规模与成本之间的尖锐矛盾。

性能提升:不只是“更快”,而是“更省”

与上一代 Blackwell 平台相比,Rubin 的提升堪称革命性:
  • 推理 token 成本降至十分之一
  • 训练相同 MoE 模型所需 GPU 数量减少至四分之一
  • 网络功耗效率提升 5 倍
具体来看:训练一个 10 万亿参数的 MoE 模型,Blackwell 需要 64,000 张 GPU,而 Rubin 仅需 16,000 张
这不仅是硬件数量的节省,更是数据中心空间、电力、运维复杂度的全面优化。

Vera CPU:为“喂数据给 GPU”而生

英伟达此前使用 Grace CPU,如今全面转向 Vera CPU——名字致敬发现暗物质证据的天文学家 Vera Rubin。

核心规格:

  • 88 个定制 Olympus 核心,176 线程
  • 1.5TB LPDDR5X 内存,带宽 1.2TB/s
  • 2270 亿晶体管
  • 支持 Arm v9.2 架构
与 Grace 对比,Vera 实现了全方位跃升:
表格
 
规格 Grace Vera
核心数 72 Neoverse V2 88 Olympus
线程数 72 176
L3 缓存 114MB 162MB
内存带宽 512GB/s 1.2TB/s
内存容量 480GB 1.5TB
NVLink-C2C 900GB/s 1.8TB/s
英伟达明确表示:Vera 的核心任务就是高效“喂数据”给 GPU,确保计算单元永不“饥饿”。

Rubin GPU:3360 亿晶体管的推理怪兽

单颗 Rubin GPU 规格如下:
  • 3360 亿晶体管(Blackwell 为 2080 亿)
  • 288GB HBM4 显存
  • 显存带宽 22TB/s(Blackwell 为 8TB/s)
  • NVFP4 推理算力 50 PFLOPS
  • 224 个 SM,第六代 Tensor Core
  • 第三代 Transformer Engine,支持硬件级自适应压缩,专为 FP4 精度优化
  • NVLink 带宽翻倍至 3.6TB/s
与 Blackwell 对比如下:
表格
 
规格 Blackwell Rubin
晶体管 2080 亿 3360 亿
NVFP4 推理 10 PFLOPS 50 PFLOPS
FP8 训练 5 PFLOPS 17.5 PFLOPS
HBM 带宽 8 TB/s 22 TB/s
NVLink 带宽 1.8 TB/s 3.6 TB/s

Vera Rubin NVL72:一整机架即一台超级计算机

Rubin 平台的旗舰配置 Vera Rubin NVL72 将 72 张 GPU、36 颗 Vera CPU、NVLink 6、ConnectX-9 和 BlueField-4 全部集成在一个机架内:
  • NVFP4 推理算力:3.6 EFLOPS
  • HBM4 总量:20.7TB
  • 系统内存:54TB
  • 机架内互联带宽:260TB/s(英伟达称“超过整个互联网”)
采用 全液冷设计,使用 45°C 温水直接冷却,冷却流量比 Blackwell 提升近一倍;同时实现 无线缆设计,组装速度提升 18 倍。

NVLink 6:72 GPU 全互联,延迟一致

第六代 NVLink 是 Rubin 平台的通信中枢:
  • 每 GPU 带宽 3.6TB/s(翻倍)
  • 全互联拓扑,任意两张 GPU 间通信延迟一致
  • 内置 SHARP 网络计算单元,提供 14.4 TFLOPS FP8 算力
  • 每个 Switch Tray 带宽 28.8TB/s
  • MoE 模型的 all-to-all 通信吞吐提升 2 倍
  • 支持热插拔、部分填充运行、动态流量重路由

BlueField-4 DPU:基础设施的“隐形引擎”

BlueField-4 不再只是辅助芯片,而是承担起网络、存储、安全等关键任务:
  • 集成 64 核 Grace CPU + ConnectX-9 网卡
  • 与 BlueField-3 对比:
表格
 
规格 BlueField-3 BlueField-4
带宽 400 Gb/s 800 Gb/s
CPU 核心 16 A78 64 Neoverse V2
内存带宽 75 GB/s 250 GB/s
内存容量 32GB 128GB
存储 IOPS 10M 20M
新增 ASTRA(Advanced Secure Trusted Resource Architecture),提供硬件级隔离,适用于裸金属与多租户环境。
还引入 “推理上下文内存存储平台”,专门缓存 KV Cache,使长上下文推理吞吐与能效均提升 5 倍。

ConnectX-9 SuperNIC 与 Spectrum-6:构建超低延迟网络底座

ConnectX-9:单端口 800Gb/s,支持 200G PAM4 SerDes、可编程拥塞控制、硬件加密(IPsec/PSP)

与 Spectrum-6 配合,在端点即可完成流量整形,避免网络拥塞

Spectrum-6 以太网交换机:
  • 单芯片带宽 102.4Tb/s(翻倍)
  • 采用 共封装光学(Co-packaged Optics) 技术:
    • 功耗效率提升 5 倍
    • 信号损耗从 22dB 降至 4dB,信号完整性提升 64 倍
    • 可靠性提升 10 倍
此外,Spectrum-XGS 支持跨地域组网,数百公里外的数据中心可视为同一集群。

推理实测:成本与能效的“十倍法则”

英伟达使用 Kimi-K2-Thinking(1T MoE 模型,32K 输入 + 8K 输出)进行测试:

同等交互性下,每瓦吞吐提升 10 倍

同等延迟下,每百万 token 成本降至十分之一

这验证了 Rubin 不仅是“更强”,更是“更可持续”。

谁在用?生态已全面就位

云厂商:

AWS、Google Cloud、Microsoft Azure、Oracle Cloud、CoreWeave、Lambda、Nebius、Nscale

AI 公司:

OpenAI、Anthropic、Meta、xAI、Mistral、Cohere、Perplexity、Black Forest Labs、Runway、Cursor、Harvey

硬件厂商:

Dell、HPE、Lenovo、Supermicro、Cisco
微软将在下一代 Fairwater AI 超算中心部署 Vera Rubin NVL72,规模达 数十万张 GPU。
CoreWeave 也确认 2026 下半年上线 Rubin 实例。

行业领袖怎么说?

  • Sam Altman(OpenAI):“Intelligence scales with compute. Rubin 让我们能继续 scale.”
  • Dario Amodei(Anthropic):“Rubin 的效率提升能让模型有更长的记忆、更好的推理、更可靠的输出。”
  • Mark Zuckerberg(Meta):“Rubin 的性能和效率提升是把最先进模型部署给几十亿用户的前提。”
  • Elon Musk(xAI):“💚🎉🚀🤖 Rubin 是 AI 的火箭引擎”
  • Satya Nadella(Microsoft):“我们在建世界上最强的 AI 超算,Vera Rubin 加进来,开发者能以全新方式创造、推理、扩展。”

何时可用?

  • Rubin 已进入量产阶段
  • 2026 下半年开始出货
  • AWS、Google Cloud、Microsoft、Oracle 将首批部署

总结

作为长期追踪 AI 基础设施的产品人,Rubin 平台让我看到一个清晰趋势:AI 算力的竞争已从“单点突破”进入“系统级协同”时代。英伟达不再只卖 GPU,而是提供一套从芯片到机架、从计算到网络的完整“AI工厂”解决方案。
对上层应用而言,这意味着:更低成本的推理、更可行的超大规模训练、更高效的长上下文处理——这些都将直接转化为产品体验的跃升。无论是做 Agent、RAG,还是多模态生成,底层算力的“十倍效率提升”终将释放出新一轮的产品创新浪潮。
Rubin 不只是一代芯片,它是一张通往下一阶段 AI 产品的通行证。而我们,正站在入口处。

 

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:英伟达CES 2026 发布下一代 AI 计算平台 Rubin:六芯片协同设计,AI算力与能效迎来十倍跃迁
#Rubin #CES 2026 #英伟达 #芯片 
收藏 1
Adnify:一个集聊天、任务执行、项目规划于一身的开源 AI IDE
人人都是小程序开发者的时代,真的来了(附实战指南)
推荐阅读
  • 谷歌这波太狠了!谷歌I/O 2025 AI全面爆发,Gemini 2.5 Pro、AI Agents、XR眼镜…开启AI新纪元
  • OpenAi 刚刚在 ChatGPT 中试点群聊功能
  • 谷歌确认今年内发布 Gemini 3,但时间可能顺延
  • 阿里 Qwen3 系列新模型:全模态AI,规模最大、能力最强的模型
  • 2025最值的联合会员,Lenny's Newsletter到底值不值得冲?独立开发者的春天?
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
23106 5月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
21923 8月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
14998 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
14701 10月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
13123 8月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13064 8月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
12294 8月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
11084 10月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
9745 1年前
Trae Pro 来了,终于可以告别排队了!这价格真香
7957 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 人人都是小程序开发者的时代,真的来了(附实战指南)
2 英伟达CES 2026 发布下一代 AI 计算平台 Rubin:六芯片协同设计,AI算力与能效迎来十倍跃迁
3 Claude Code 桌面版发布:本地多会话并行 + 一键云端,AI 编程助理终于融进工作流了
4 2025年度AI报告合集|深度解读行业趋势与技术突破
5 实测 PaddleOCR 3.3:109 种语言与结构化解析,一次部署覆盖大部分文档场景
6 智谱发布 ZCode 编辑器:Claude Code、Codex、Gemini顶级AI编程无缝切换的可视化Agent
7 MiniMax 发布 M2.1:速度明显提升
8 TRAE 国内版 SOLO 面向全部用户开放
9 Fun-Audio-Chat:阿里巴巴发布全新开源语音交互大模型
10 智谱 GLM-4.7 旗舰模型发布:总参数355B,代码能力超越 GPT-5,价格仅 1/7!
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联