10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
留言板 小程序 交流群 关于我

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源

DeepSeek-V3 模型更新版本号 DeepSeek-V3-0324,推理能力、代码编写、中文写作等方面全面提升(提示词分享)

3月前 2233 0

25日官方正式发布:DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。

次更新不仅在推理能力、代码编写、中文写作等方面实现了全面提升,更是在 Web 前端开发领域碾压Claude,剑指GPT-4.5!

推理任务增强

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

美国数学邀请赛 (AIME): DeepSeek V3 在该测试中进步最为显著,展现了其强大的数学推理能力。

LiveCodeBench: 这是一个评估模型编写、理解和调试代码能力的基准。DeepSeek V3 在此项测试中的表现预示着其代码理解和生成能力的提升。

MMLU-Pro: MMLU 测试模型在多个学科(人文、社会科学等)的知识和推理能力。DeepSeek V3 的进步表明其知识面和跨学科推理能力得到了增强。

GPQA: GPQA 是通用问答基准,用于评估模型在开放性或多样性问题上的表现。DeepSeek V3 的提升意味着它在处理更复杂、更开放式问题时将更加得心应手。

代码能力飞跃

中文模型一直在代码能力上一直与Claude相去甚远,这次代码编写能力可以说是有质的飞跃,尤其是前端开发。这一点与目前最新的Claude 3.7 Sonnet 非常相似。主要体现在代码准确率的提升,以及模型本身审美的提升。

上图由deepseek生成

SVG生成提示词

提示词太长,苏米把提示词放到公众号下载,可通过关注《苏米客》公众号,回复“提示词”获得。

在前端代码上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。苏米测试生成了一个手机UI原型测试了一下。

上图由deepseek生成的原型界面

原型生成提示词

提示词太长,苏米把提示词放到公众号下载,可通过关注《苏米客》公众号,回复“提示词”获得。

中文写作能力

DeepSeek作为优秀中文大语言模型,在中文写作能力上是毋庸置疑的,此次升级更是对中文写作的风格和内容进行了优化,风格和 DeepSeek-R1 对齐,内容主要是中长篇写作质量的提升。

上下滑动查看完整内容

功能增强方面有三点:多轮交互改写能力提升(上下文);翻译质量和书信类写作的优化;中文搜索能力的优化。

模型开源

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。V3-0324 模型权重下载请参考:

Model Scope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324

Huggingface:

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

总结

就在更新之后不久,苏米已经在各大博主的分享中看到了非常多关于这几项升级后的能力测试,从技术角度看,它代表了中国AI代码编程技术的又一次跃升;从应用角度看,它预示着中文内容创作领域的又一次降维打击。这是国外一众AI大模型无法企及的。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
#DeepSeek #V3模型 #DeepSeek更新 #DeepSeek提示词 
收藏 1
推荐阅读
  • 震惊!这个开源项目挖了Cursor、v0、Manus等完整的各大AI模型官方系统提示词
  • 即梦AI图片3.0:AI文生图新王诞生!中文海报天花板「影视质感+文字精准+2K高清」
  • 谷歌旗下 DeepMind 推出 Genie 2 模型,可生成长达 1 分钟的游戏世界
  • MiniMax五连发:MiniMax-M1、MiniMax Agent、Hailuo 02、Video Agent、Audio语音定制
  • Uizard:Autodesigner 2.0 AI生成式辅助UI设计工具,产品经理+UI设计
评论 (0)
请登录后发表评论
分类精选
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
13669 4月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
9975 1月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
9830 6月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
7361 2月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
6959 4月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
6667 6月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
6584 2月前
字节全新AI编程 IDE:Trae!性能对标Cursor,标配Claude 3.5和GPT-4o,免费无限量
4445 5月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
4251 2月前
N 种 DeepSeek + X 的实用集成,DeepSeek官方整理了50+插件及多领域应用场景方案
3613 4月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Desktop Extensions (DXT):Anthropic又出AI Agent神器,一键式MCP服务器安装工具
2 Pro plus?Pro+?Cursor 悄悄上新“中杯”套餐,定价60/月
3 Cursor Agents 上线 Web & 移动端!随时随地远程调 Agent 写代码
4 谷歌放大招!免费开源的 Gemini CLI,冲着Claude Code来的!
5 Kimi深度研究:Kimi发布首个Ai Agent,模型即 Agent
6 Warp 2.0:这个媲美Claude code的AI终端工具,刚更新就放出免费领一个月Pro会员!
7 MiniMax五连发:MiniMax-M1、MiniMax Agent、Hailuo 02、Video Agent、Audio语音定制
8 码上飞:只动嘴,App就能做出来?我用「码上飞」5分钟开发了一个AI应用
9 文心快码 Comate AI IDE:百度全新AI编程工具,这回是IDE,真能对标Cursor?
10 Augment Code:又一款AI编程工具,号称取代Cursor指日可待,还真有点东西!
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
程序库 免费影视APP 花式玩客 免费字体下载 产品经理导航 Axure RP 10 免费Axure模板 Axure原型设计 Axure元件库下载 申请友联