在浏览和体验了数百个AI开源项目后,我发现一个有趣的现象:真正高影响力的项目往往来自业界顶级研究者的个人实践。
Andrej Karpathy 作为OpenAI创始成员、特斯拉自动驾驶前任负责人,他开源的项目和分享的信息源策略,反映了一个资深技术人士如何系统地学习和获取知识。

本文将梳理他的核心开源项目,以及最近开源的92个高质量信息源,帮助你理解这些资源的实际价值。
Karpathy 的开源项目体系
1. nanoGPT:极简的模型实现参考
nanoGPT 是为教学和研究设计的最小化GPT训练库。

与工业级框架(如Hugging Face Transformers)不同,它的定位很明确:通过代码清晰性换取功能丰富度。

核心特点:
- 代码极简:核心逻辑由两个约300行的文件组成。model.py 定义Transformer架构,train.py 实现完整训练循环
- 功能完整:支持分布式训练、Flash Attention混合精度、与OpenAI官方权重兼容
- 适配场景:适合想要理解GPT底层原理的开发者,而非生产环境部署
- 学习成本:相比工业级框架,上手难度低,但扩展性受限
2. nanoChat:从预训练到对话的完整链路
如果说 nanoGPT 聚焦预训练阶段,nanoChat 则是端到端的大模型训练框架,包含了将基础模型转化为ChatGPT风格的对话模型所需的全部步骤。

核心功能对比:
| 维度 | nanoGPT | nanoChat |
| 核心目标 | 预训练(下一个token预测) | 完整对话系统(预训练+SFT+RLHF) |
| 代码量 | ~600行 | ~8000行 |
| 包含组件 | Transformer模型+训练循环 | 分词器、SFT、强化学习、Web界面 |
| 使用成本 | 学习导向 | 可用100美元训练可交互的聊天模型 |
特色功能:
- 内置Web聊天界面,训练后可直接与模型交互
- 覆盖分词器训练、有监督微调(SFT)、强化学习(RLHF)全流程
- 低成本可验证:用小规模数据在个人设备上完成全流程
两个项目的适配场景:
选择 nanoGPT:你想深入理解Transformer架构、自注意力机制、token生成过程
选择 nanoChat:你想体验完整的模型训练流程,最终得到一个能对话的模型
对标方案:如果需要生产级别的训练框架,可考虑 LLaMA-Factory 或 OpenRLHF
Karpathy 的信息源策略:92个高质量博客订阅源
背景:为什么是RSS?
Karpathy 在最近的一份分享中指出,当代社交媒体充斥着为诱导点击和情绪激发而生成的碎片化内容。
他的应对策略是回归RSS订阅——通过订阅优质博主的长篇内容,规避算法操控和信息茧房。

信息源来源:
他开源了一份OPML格式的订阅源文件,收集了2025年Hacker News上最受欢迎的92个博客。
Hacker News 是Y Combinator运营的聚合网站,在科技界、程序员社区和创业圈拥有高度认可度,是获取深度技术资讯的重要渠道。
订阅源文件:https://gist.github.com/emschwartz/e6d2bf860ccc367fe37ff953ba6de66b
如何使用这份订阅源
步骤1:下载OPML文件
访问上述链接,下载 hn-popular-blogs-2025.opml 文件到本地

步骤2:选择RSS阅读器
常用开源选项:
Folo:https://github.com/RSSNext/Folo(现代化UI,支持多平台)

NetNewsWire:https://github.com/Ranchero-Software/NetNewsWire(macOS原生,轻量级)

其他选项:Feedly、Inoreader(付费方案更全面)
步骤3:导入并订阅
在RSS阅读器中导入下载的OPML文件,即可获得92个热门博客的完整订阅列表



订阅源中的代表性博主
实务型AI研究者:
Simon Willison(Django框架联合创始人):专注于AI的实际应用,手工测试新模型,分享Prompt工程细节、API使用心得和安全漏洞

创意工程师:
Neal Agarwal:设计趣味互动网页而非枯燥技术文档,代表作《Stimulation Clicker》讽刺互联网多巴胺成瘾现象

技术思想领袖:
Paul Graham(YC创始人):虽然更新频率低,但每篇文章都会引发社区广泛讨论
John Gruber:苹果生态评论的权威声音
底层技术深度挖掘:
Julia Evans:用漫画形式解释Linux内核、网络协议等复杂概念
学术研究前沿:
Terence Tao(陶哲轩):数学界顶流,分享前沿数学研究思路
这份信息源的适配人群
AI从业者:获取最新的技术动态和深度分析,而非营销文章
工程师:学习底层原理和实践经验,拓展技术视野
创业者/产品经理:理解技术趋势和市场格局
对抗信息污染:有意识地避免算法推荐的碎片化内容
结语
经过这些年体验和推荐开源项目的过程中,我意识到优质项目和优质信息源有一个共同特点:都强调清晰性和可理解性。
nanoGPT和nanoChat用代码清晰性换取教学价值,RSS订阅源通过人工精选换取内容深度。
Karpathy的这套方法论启示我们,在信息爆炸的时代,学习和获取知识的最有效路径往往不是追求"大而全",而是选择"小而精"的资源,深入理解其中的原理和思想。
如果你想系统地学习AI技术原理或获取高质量的技术资讯,这两个项目无疑是很好的起点。