10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

DeepSeek-V3.1正式发布,并同步开源!

4月前 AI最新动态 1478 0

DeepSeek突然更新V3.1版本

这好像也算不上好消息,时隔大半年,我们依然没等到DeepSeek V4或R2的上线。

这真是一个让人又兴奋又有点无奈的消息!不过,先别急着欢呼,仔细看看,会发现这次更新有点“出乎意料”的微妙。

V4还没影子

V3.1的发布意味着什么?对我这种天天盯着大模型动态的人来说,有点像“久等的惊喜里带点失落”。自从上次版本更新到现在,已经过去大半年了,但我们仍然没有等到V4或者R2。短期内,看来也不会有重大版本更新出现。

从体验上看,V3.1的变化更像是在后训练强化学习(Post training RL)环节做了优化,而预训练语料仍停留在2024年7月。具体表现:

  • 它仍然认为世界最佳大模型是GPT-4 turbo;

  • 知道6月份的法网冠军,但在奥运女单冠军上出现了小幻觉;

  • 编程能力没有明显提升,但处理简单非结构化提示词时已经能给出不错的效果。

所以,如果你期待一次“翻天覆地”的升级,可能得再等等。

V3.1开源来了

但就在大家稍微有点失望的时候,DeepSeek团队在Hugging Face上投下了一颗炸弹:DeepSeek-V3.1的基座模型正式开源了!没错,是V3.1,不是V4,也不是R2。这个基座模型传说拥有万亿参数,采用MoE(Mixture-of-Experts)架构,一时间整个开源社区都炸开了锅。

对我们开发者来说,这意味着可以在自己的项目里直接试用接近旗舰级别的模型,甚至可以研究MoE架构在真实场景下的应用和优化。

DeepSeek-V3.1-Base核心亮点

  • 6850亿参数:庞大的模型规模,结合MoE架构,在复杂任务中表现出色。

  • MoE架构:只激活部分专家网络就能推理,大幅提高效率,同时降低计算成本。

  • 多精度支持:BF16、F8_E4M3和F32灵活选择,尤其是FP8量化优化,让推理更高效。

  • Safetensors格式:相比传统PyTorch pickle,更安全、更快加载。

  • 预设对话模板:直接应用于对话式AI场景,降低集成门槛。

  • 推动开源生态:降低高性能大模型使用门槛,让学术研究、企业创新和个人开发者都能快速上手。

MoE架构,为什么值得关注?

简单来说,MoE就是把一个大模型拆成多个“小专家”,再用一个“门控网络”动态选择最合适的专家处理当前任务。优势明显:

  • 参数效率:推理时只激活部分参数,节约计算资源;

  • 性能提升:不同专家专注不同类型任务,多样化场景表现更好;

  • 可扩展性:容易扩展到更大规模,为未来AI能力边界提供可能。

所以,这次开源的V3.1-Base,对想研究MoE的开发者和学术团队来说,是个宝贵资源。

部署与使用

目前,V3.1-Base还没有被第三方推理服务提供商部署,但估计很快就会有厂商适配。大家可以直接去Hugging Face下载和探索:

  • DeepSeek-V3.1-Base 模型主页

  • DeepSeek-V3.1 模型集合

总结

作为一个每天都在折腾AI工具的产品经理,如果你和我一样喜欢折腾AI模型,不妨直接去下载V3.1-Base,亲自感受一下MoE的魅力,也许会有意想不到的收获。

你怎么看DeepSeek-V3.1的开源?评论区聊聊你的期待吧!

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:DeepSeek-V3.1正式发布,并同步开源!
#DeepSeek V3.1 #DeepSeek #DeepSeek开源 
收藏 1
PicDoc:一秒文本秒变图表,可视化图表效率神器,国内免费使用!
Anthropic 到处封杀!OpenCode打通 ChatGPT 订阅,这波赢麻了!
推荐阅读
  • ChatGPT 原生图像生成功能已免费开放,免费版每天获得 3 次图像生成机会
  • Qwen3 循环报错!扣钱!欠费!Qwen3-Coder使用避坑指南
  • 快手发布 AI 编程矩阵:AI编程工具 CodeFlicker、自研的大模型 KAT-Coder
  • 火山方舟满血版DeepSeek R1 API免费体验,可薅145元代金券!不封顶(附API接入教程)
  • 腾讯混元多模态实时生图:AI生图已经进化到“毫秒级”,实时生成高精度图像
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
23336 6月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
22134 8月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
15110 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
14720 10月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
13310 8月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13101 8月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
12363 9月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
11183 10月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
9829 1年前
Trae Pro 来了,终于可以告别排队了!这价格真香
8075 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Anthropic 到处封杀!OpenCode打通 ChatGPT 订阅,这波赢麻了!
2 CES 2026 观察:AI 不再是单独的产品,而是硬件的默认引擎
3 智谱上市赠礼活动送旺旺贴!我申请了,你领了吗?
4 腾讯混元超强开源翻译模型 HY-MT1.5:本地部署的多语言翻译、方言,实时翻译
5 人人都是小程序开发者的时代,真的来了(附实战指南)
6 n8n 2.x 重大更新,让工作流走向对话式:Chat Hub、Agent、工作流对话
7 英伟达CES 2026 发布下一代 AI 计算平台 Rubin:六芯片协同设计,AI算力与能效迎来十倍跃迁
8 Claude Code 桌面版发布:本地多会话并行 + 一键云端,AI 编程助理终于融进工作流了
9 2025年度AI报告合集|深度解读行业趋势与技术突破
10 实测 PaddleOCR 3.3:109 种语言与结构化解析,一次部署覆盖大部分文档场景
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联