10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

GPT-5 难产,但开源了 gpt-oss-120b 与 gpt-oss-20b 模型

10月前 AI最新动态 1556 0

是的GPT-5 难产了,网友们等得实在着急,各种梗图满天飞,堪称"万梗齐发"。

时不时有点料,但又不是真发布,前面有挖出GPT-5-Auto和GPT-5-Reasoning两个神秘模型;接着又传出微软的Copilot和Cursor也已经偷偷用上了GPT-5进行内测。

这难道是在搞测试?但今天苏米要说的是GPT-5虽然难产了,但昨天却开源了两大全新顶级模型:gpt-oss-120b 、 gpt-oss-20b,OpenAI毫无预兆地放了个大招,不仅直接官宣发布开源模型,还一口气来了两个!

没错,就是大家疯狂猜测、屡次"泄密"的那波,正是120B和20B两个不同规模,分别命名为gpt-oss-120b和gpt-oss-20b。

Apache 2.0开源

跟以往的"GPT系列"不一样,这次是完全开放参数模型(open-weight),参数文件直接下载,代码、架构、推理方法全部敞开。通俗点说,你可以像搬家一样把OpenAI的"智慧"搬到自己电脑、服务器,甚至笔记本上,想怎么玩怎么玩,不需要API,零门槛自助可控。

  • • gpt-oss-120b:1170亿参数,采用MoE(Mixture-of-Experts)技术,能在一张80GB的H100显卡上单独运行,推理速度堪比O4-mini。适用于超高推理能力、高并发场景。

  • • gpt-oss-20b:210亿参数,普通16GB内存的设备都能带动,甚至消费级笔记本都能本地用!本地化、低延迟、专属小型应用直接无压力。

两个模型都挂着Apache 2.0开源协议,没有任何限制,爱怎么用怎么用,敢想敢造就是你的自由!

优势亮点

这次GPT-OSS不是"纯大力模型",而是混合专家架构(MoE):一个模型里有多组专家,推理时只激活一部分,既保证大模型的记忆力,又能节省显存。举个例子,gpt-oss-120b虽然总参数1170亿,但推理时只有5.1亿参数被激活,用一次只吆喝一个"智囊团"干活,除此这外还有多个亮点:

极致性价比与灵活部署

gpt-oss-20b直接可以笔记本跑,办公、小型私有部署、边缘计算场景直接起飞。gpt-oss-120b则是高性能场合王炸,一块卡吃掉过去一排服务器的活。

透明可控,安全可自查

全部参数开放,没有黑箱,每个推理路径你都能可视化,开发者和研究者的福音。

顶级推理能力+全链路开源

OpenAI宣称,gpt-oss-120b推理能力接近自家O4-mini,gpt-oss-20b媲美O3-mini——这都是业内一线的性能。

多用途,灵活可微调

两个模型都支持自定义微调+链式思维(chain-of-thought)推理,可做多轮任务、代码分析、复杂推理,甚至直接"复用"OpenAI Harmony响应格式,低代码迁移。

工具调用,原生Agent能力

支持函数调用、网页浏览、Python代码执行、结构化输出……什么"智能体Agent",这就是"原生地表最强"。

部署成本

Hugging Face、Ollama、Northflank等平台第一时间上线了一键部署方案,不会Docker不会云也能玩转开源AI。

OpenAI和合作伙伴直接集成了主流AI推理引擎(如vLLM、Transformers Serve、Ollama等),一行命令直接拉起本地服务。

简单pip install、huggingface-cli或transformers调用,笔记本开发、云端生产一把梭。

结语

OpenAI自GPT-2后首次完全开源高性能大模型,结束了长达6年的API+闭源垄断。

Meta Llama、Mistral、Deepseek、Qwen等强力开源模型,迎来史诗级对手。这下"生态混战"直接升级,未来一年开源AI领域必然腥风血雨。

开源是加速混战的重要武器,且看OpenAI持续发力!

模型资源链接

  • OpenAI 官方发布页面:https://openai.com/open-models/

  • OpenAI 体验地址页面:https://gpt-oss.com/

  • GPT-OSS-120B 模型:https://huggingface.co/openai/gpt-oss-120b

  • GPT-OSS-20B 模型:https://huggingface.co/openai/gpt-oss-20b

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:GPT-5 难产,但开源了 gpt-oss-120b 与 gpt-oss-20b 模型
#GPT 5 #OpenAI #GPT开源 
收藏 1
Riff:AI音乐制作工具,提供直观的音乐编辑器和AI辅助功能
Claude Opus 4.1模型抢先发布,OpenAI还在挤牙膏,Cursor已支持最新模型
推荐阅读
  • GPT‑5来了?Cursor、Copilot、macOS等悄悄内测,全网疯传GPT-5泄露!
  • GPT-Image-2 灰度测试作品展示:多风格图像生成能力详解
  • WorkBuddy(腾讯版小龙虾)开箱即用,全场景智能桌面版
  • 阿里发布AI 图像编辑模型Qwen‑Image‑Edit,真的够用吗?
  • Trae 2.0 即将发布,全新SOLO模式重新定义AI编程体验
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30982 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28174 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
19758 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19557 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16136 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
16039 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15591 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14885 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14284 1年前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
13779 2月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 4 个免费 Token 渠道全攻略:两个月没花一分钱
2 ZCode 3.0 + GLM-5.2 深度评测:国产 AI 编程工具的最佳组合
3 Kimi K2.7 Code 模型发布:长程编程 token 消耗降 30%,6 倍速高速版即将上线
4 OpenCode 发布大模型调用数据报告:DeepSeek 用量第一,Qwen 缓存命中率 98%
5 GLM-5.2 发布:1M 上下文 + 全量开放,国产 Coding 模型新标杆
6 Claude Fable 5 全球下线始末,当安全叙事成为监管利器
7 Claude Fable 5 vs GPT-5.5 实测对比,2026 年编程 AI 选型指南
8 小米开源 MiMoCode,5 人 14 天打造的 AI 编程 Agent,支持跨会话记忆与多 Agent 协作
9 Google Gemini 3.5 Live Translate:70+语言实时同声翻译模型发布
10 火山方舟Coding Plan 和 Agent Plan 系列套餐 618特惠9.9元起,旗舰模型19元购
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联