10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

DeepSeek-V4 蒸馏版本地部署实测:5.6GB 就能跑,推理风格高度还原

1月前 AI最新动态 1625 0

DeepSeek-V4 发布两周后,社区终于推出了可本地部署的蒸馏版本。发布仅三天,下载量就突破数万。第一时间实测了部署和使用效果,下面分享完整流程。

什么是 DeepSeek-V4 蒸馏版?

社区模型 Jackrong/Qwen3.5-9B-DeepSeek-V4-Flash-GGUF 是基于 Qwen3.5-9B 做的 DeepSeek-V4 蒸馏版。简单来说,就是用 DeepSeek-V4-Flash 的高质量推理数据来增强一个 9B 小模型,让它学到结构化推理、多步分析和工具调用能力。

DeepSeek-V4 蒸馏版模型页面

核心优势是体积小、部署门槛低。GGUF 的 Q4_K_M 版本约 5.63GB,普通本地电脑就有机会跑起来。主要面向结构化推理、快速本地推理和工具增强工作流。

适用场景:个人电脑低成本体验 DeepSeek-V4 推理风格,用于本地知识库、Agent 和自动化工作流测试。

部署步骤

第一步:下载 LM Studio

LM Studio 下载页面

第二步:搜索并下载模型

在 LM Studio 中搜索模型名称:Jackrong/Qwen3.5-9B-DeepSeek-V4-Flash-GGUF

搜索模型

找到后点击下载:

下载模型

第三步:加载使用

加载模型

实测效果

在 LM Studio 中使用模型回答问题:

模型回答示例

问一个编程题:

编程题测试

为了验证蒸馏后的 9B 模型是否真的更像 DeepSeek-V4,将蒸馏版和原版 Qwen3.5-9B 的思考过程发给 Gemini 3.1 Pro 进行对比评估。

原版 Qwen3.5-9B 的思考过程:

原版模型思考过程

让 Gemini 评估哪个更像 DeepSeek-V4:

Gemini 评估
评估结果
评估总结

Gemini 的结论是:原版 9B 生成的内容只是一个"写作大纲"(Outline),直接给出结论并规划结构;而蒸馏版 9B 生成的是真正的"推理链",展示了从"接收问题 → 评估意图 → 检索知识 → 考虑边界条件 → 权衡优缺点 → 确定最终回答策略"的完整认知过程,与 DeepSeek 推理模型(如 DeepSeek-R1)的长思考、慢决策特点完美契合。

结论:蒸馏 9B 实打实模仿到了 DeepSeek-V4 的推理风格。

知识库(RAG)测试

用 LM Studio 做知识库的局限是:最多上传 5 个文件,单个文件低于 30MB。

LM Studio 知识库限制

初步测试 RAG 效果:

RAG 测试
RAG 回答结果
:

结论:做 RAG(检索增强生成),蒸馏的 9B 模型也更适合、更强大。Gemini 给出的评价是蒸馏 9B 已经够到第一梯队。

最终对比结果

总结

DeepSeek-V4 蒸馏版在本地部署后,实测其回答效果确实优于原版 9B 模型。不管回答问题还是做知识库,蒸馏版都表现出了更接近 DeepSeek-V4 的推理能力。

如果你有一台普通电脑,想低成本体验 DeepSeek-V4 的推理风格,可以按照上述步骤部署试试。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:DeepSeek-V4 蒸馏版本地部署实测:5.6GB 就能跑,推理风格高度还原
#DeepSeek #V4 #本地部署 #LMStudio #蒸馏模型 
收藏 1
WSL Dashboard:10 年来终于有人做了 WSL 可视化管理
Vibe Trading:用自然语言做量化交易,AI 驱动的多代理金融工作台
推荐阅读
  • n8n 2.0 来了,到底改了什么?升级迁移项目该怎么做?
  • ChatGPT Search 上线,ChatGPT变身 AI 搜索引擎挑战 Google,网页、桌面、移动端全面开放(附 Chrome 插件)!
  • 谷歌旗下 DeepMind 推出 Genie 2 模型,可生成长达 1 分钟的游戏世界
  • 即梦悄悄上线数字人新模型OmniHuman 1.5,会跑会跳,能唱能演,还能变脸
  • 字节再放大招:豆包 Seed 2.0 专家模式现已上线!
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30982 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28173 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
19758 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19557 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16136 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
16039 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15591 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14885 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14284 1年前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
13778 2月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 4 个免费 Token 渠道全攻略:两个月没花一分钱
2 ZCode 3.0 + GLM-5.2 深度评测:国产 AI 编程工具的最佳组合
3 Kimi K2.7 Code 模型发布:长程编程 token 消耗降 30%,6 倍速高速版即将上线
4 OpenCode 发布大模型调用数据报告:DeepSeek 用量第一,Qwen 缓存命中率 98%
5 GLM-5.2 发布:1M 上下文 + 全量开放,国产 Coding 模型新标杆
6 Claude Fable 5 全球下线始末,当安全叙事成为监管利器
7 Claude Fable 5 vs GPT-5.5 实测对比,2026 年编程 AI 选型指南
8 小米开源 MiMoCode,5 人 14 天打造的 AI 编程 Agent,支持跨会话记忆与多 Agent 协作
9 Google Gemini 3.5 Live Translate:70+语言实时同声翻译模型发布
10 火山方舟Coding Plan 和 Agent Plan 系列套餐 618特惠9.9元起,旗舰模型19元购
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联