10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
留言板 小程序 交流群 关于我

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源

DeepSeek-V3 模型更新版本号 DeepSeek-V3-0324,推理能力、代码编写、中文写作等方面全面提升(提示词分享)

1月前 1195 0

25日官方正式发布:DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。

次更新不仅在推理能力、代码编写、中文写作等方面实现了全面提升,更是在 Web 前端开发领域碾压Claude,剑指GPT-4.5!

推理任务增强

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

美国数学邀请赛 (AIME): DeepSeek V3 在该测试中进步最为显著,展现了其强大的数学推理能力。

LiveCodeBench: 这是一个评估模型编写、理解和调试代码能力的基准。DeepSeek V3 在此项测试中的表现预示着其代码理解和生成能力的提升。

MMLU-Pro: MMLU 测试模型在多个学科(人文、社会科学等)的知识和推理能力。DeepSeek V3 的进步表明其知识面和跨学科推理能力得到了增强。

GPQA: GPQA 是通用问答基准,用于评估模型在开放性或多样性问题上的表现。DeepSeek V3 的提升意味着它在处理更复杂、更开放式问题时将更加得心应手。

代码能力飞跃

中文模型一直在代码能力上一直与Claude相去甚远,这次代码编写能力可以说是有质的飞跃,尤其是前端开发。这一点与目前最新的Claude 3.7 Sonnet 非常相似。主要体现在代码准确率的提升,以及模型本身审美的提升。

上图由deepseek生成

SVG生成提示词

提示词太长,苏米把提示词放到公众号下载,可通过关注《苏米客》公众号,回复“提示词”获得。

在前端代码上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。苏米测试生成了一个手机UI原型测试了一下。

上图由deepseek生成的原型界面

原型生成提示词

提示词太长,苏米把提示词放到公众号下载,可通过关注《苏米客》公众号,回复“提示词”获得。

中文写作能力

DeepSeek作为优秀中文大语言模型,在中文写作能力上是毋庸置疑的,此次升级更是对中文写作的风格和内容进行了优化,风格和 DeepSeek-R1 对齐,内容主要是中长篇写作质量的提升。

上下滑动查看完整内容

功能增强方面有三点:多轮交互改写能力提升(上下文);翻译质量和书信类写作的优化;中文搜索能力的优化。

模型开源

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。V3-0324 模型权重下载请参考:

Model Scope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324

Huggingface:

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

总结

就在更新之后不久,苏米已经在各大博主的分享中看到了非常多关于这几项升级后的能力测试,从技术角度看,它代表了中国AI代码编程技术的又一次跃升;从应用角度看,它预示着中文内容创作领域的又一次降维打击。这是国外一众AI大模型无法企及的。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
#DeepSeek #V3模型 #DeepSeek更新 #DeepSeek提示词 
收藏 1
推荐阅读
  • Monica内测发布内置满血版DeepSeek,集聊天、翻译、写作、思维导图、流程图、数据分析等一站式AI助手
  • 火山方舟满血版DeepSeek R1 API免费体验,可薅145元代金券!不封顶(附API接入教程)
  • 震惊!这个开源项目挖了Cursor、v0、Manus等完整的各大AI模型官方系统提示词
  • 即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
  • Manus发布!深度解读全球首个真正意义上的通用型 Agent,是否真的被颠覆
评论 (0)
请登录后发表评论
分类精选
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
9159 5月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
5601 5月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
5245 1月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
4771 2月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
4560 1周前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
3744 2月前
Cline v3.1 更新!Cline + DeepSeek最佳自主的 AI 编程助手来了,Cursor平替
3283 4月前
N 种 DeepSeek + X 的实用集成,DeepSeek官方整理了50+插件及多领域应用场景方案
2915 3月前
Cursor:年度最佳AI辅助编程代码生成器工具,生成代码、修改代码,提升编程效率
2630 5月前
字节全新AI编程 IDE:Trae!性能对标Cursor,标配Claude 3.5和GPT-4o,免费无限量
2613 3月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 OpenAI Codex:云端 AI 编程助手的“返祖”
2 Windsurf Wave 9 SWE-1 模型如何重塑软件工程全流程:从写代码到理解开发流程
3 腾讯混元多模态实时生图:AI生图已经进化到“毫秒级”,实时生成高精度图像
4 Bolt.new 这次更新,让我看到了前端全栈AI编程工具的希望
5 Void:完全免费的开源AI代码编辑器来了,堪称Cursor开源平替?Hacker News热搜第一!
6 Cursor 教育优惠风险提示:SheerID验证error、学信网二次审核、国科大研究所等可能引发Cursor 风控
7 Windsurf Wave 8 重新定义AI编辑器,自定义工作流与多线程模式的革新
8 学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
9 AI编程大事件:苹果入局Vibe Coding、OpenAI天价收购Windsurf、Cursor估值狂飙,拆解Vibe Coding爆火逻辑
10 Windsurf新LOGO和新免费计划:全面升级的AI编程体验
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
免费影视APP 花式玩客 免费字体下载 产品经理导航 Axure RP 10 免费Axure模板 Axure原型设计 Axure元件库下载 原创Axure模板 申请友联