当前位置：首页 » AI最新动态

DeepSeek 官方Github开源及DeepSeek相关Github开源项目合集

4月前 AI最新动态 1268 0

DeepSeek 是一家致力于探索通用人工智能（AGI）的公司，近期通过“开源周”活动发布了多个开源项目，涵盖了模型训练、推理优化、并行计算等多个领域。DeepSeek 的开源项目不仅展示了其在 AI 领域的技术实力，还通过开放共享推动了行业的整体进步。

如果你对这些项目感兴趣，可以通过下面链接获取更多详细信息。以下是 DeepSeek 开源项目的主要内容和相关信息：

官方开源

项目名称	项目链接	简介
DeepSeek-R1	https://github.com/deepseek-ai/DeepSeek-R1	DeepSeek的旗舰语言模型，提供高质量的响应，支持多种自然语言处理任务。
DeepSeek-V3	https://github.com/deepseek-ai/DeepSeek-V3	DeepSeek的第三个版本，采用创新的混合专家架构（MoE），支持多模态搜索。
DeepSeek-V2	https://github.com/deepseek-ai/DeepSeek-V2	一款强大、经济高效的专家混合语言模型
DeepSeek-Coder-V2	https://github.com/deepseek-ai/DeepSeek-Coder-V2	采用混合专家（Mixture-of-Experts，MoE）架构，突破闭源模型在代码智能中的壁垒
DeepSeek-Coder	https://github.com/deepseek-ai/DeepSeek-Coder	用于辅助代码编写的AI工具，支持多种编程语言。
DeepSeek-LLM	https://github.com/deepseek-ai/DeepSeek-LLM	提供准确可靠答案的综合语言模型。
Janus	https://github.com/deepseek-ai/Janus	统一的多模态理解与生成模型
DreamCraft3D	https://github.com/deepseek-ai/DreamCraft3D	基于引导扩散先验的分层3D生成模型的官方实现
DeepSeek-Math	https://github.com/deepseek-ai/DeepSeek-Math	通过增强模型的数学理解和推理能力，突破了传统语言模型在数学领域的限制，能够处理更复杂的数学推理任务，如符号计算、定理证明等
DeepSeek-MoE	https://github.com/deepseek-ai/DeepSeek-MoE	创新的混合专家架构模型，支持高效推理。
DeepSeek-VL2	https://github.com/deepseek-ai/DeepSeek-VL2	用于先进多模态理解的专家混合视觉-语言模型
DeepSeek-VL	https://github.com/deepseek-ai/DeepSeek-VL	通过深度学习技术增强视觉和语言的融合，解决复杂的视觉-语言任务

其他有关 DeepSeek 开源项目

项目名称	项目链接	简介
DeepSeek-API-Integration	https://github.com/deepseek-ai/awesome-deepseek-integration	整理了DeepSeek API的集成应用，支持多种平台和语言。
GPT4Free	https://github.com/xtekky/gpt4free	提供免费访问DeepSeek V3 & R1等模型的接口。
CherryStudio	https://github.com/CherryHQ/cherry-studio	支持包括DeepSeek-R1在内的多款LLM的桌面客户端。
TinyZero	https://github.com/Jiayi-Pan/TinyZero	伯克利团队复现DeepSeek R1-Zero的项目。
simpleRL-reason	https://github.com/hkust-nlp/simpleRL-reason	港科大团队复现DeepSeek R1-Zero和R1的项目。
DeepSeek-Free	https://github.com/deepseek-free/deepseek-free	提供DeepSeek部署教程和免费API接口。
Unlock-DeepSeek	https://github.com/datawhalechina/unlock-deepseek	面向AI研究爱好者的DeepSeek系列工作解读和复现。

开源周回顾：5天5大硬核项目

DeepSeek此次开源周以“每日一弹”形式，依次开放了5个核心项目，均聚焦AI基础设施的优化与创新：

1. FlashMLA（2月24日）

定位：专为英伟达Hopper GPU（如H100/H800）优化的高效MLA解码内核。

性能：在H800 GPU上实现3000GB/s内存带宽与580TFLOPS算力，支持可变长度序列处理，已投入生产环境。

2. DeepEP（2月25日）

突破：首个面向MoE（混合专家）模型的开源专家并行（EP）通信库。

亮点：支持NVLink和RDMA高速通信，原生适配FP8低精度运算，显著提升集群训练效率。

3. DeepGEMM（2月26日）

创新：高效FP8通用矩阵乘法库，核心逻辑仅300行代码，性能却超越传统专家调优内核。

应用：在Hopper GPU上实现1350+ TFLOPS的FP8性能，适配传统稠密模型与MoE模型。

4. DualPipe & EPLB（2月27日）

双工具：双向流水线并行算法（DualPipe）解决计算通信重叠问题；专家并行负载均衡器（EPLB）优化资源分配，提升训练稳定性。

5. 3FS文件系统（2月28日）

性能怪兽：专为SSD和RDMA网络设计的高性能并行文件系统，聚合读取吞吐量达6.6 TiB/s（180节点集群），支持AI训练全流程（数据加载、检查点保存等）。

总结

DeepSeek的开源周不仅是技术实力的展示，更是一场“车库创业精神”的宣言——正如其创始人梁文锋所言：“技术没有象牙塔，唯有社区共筑的创新力量”。这场开源行动或将重新定义AI行业的竞争格局，让技术普惠真正照进现实。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：DeepSeek 官方Github开源及DeepSeek相关Github开源项目合集

请登录后发表评论