AI开源项目
关注最新的AI开源项目,AI智能体开源、AI大模型开源、Github开源工具等
VideoCaptioner:给视频秒加双语字幕,还能自动翻译的开源神器
平时我在体验AI工具时,经常会遇到这样一个场景:明明能听懂视频里的内容,但没有字幕的时候,总觉得少了点“安全感”。尤其是当面对外语视频时,即便听力还不错,长时间盯着没有字幕的内容,依然会感到吃力。
最近我发现了一款特…
Aser:轻量级模块化 AI Agent 框架,连接 Web3 与智能体的桥梁
来自L友的推荐,支持一下!
Aser,它不仅是一个极简、模块化的 AI Agent 框架,还天然支持 Web3 和链上应用的对接。对我来说,这是一个很有代表性的“AI + Onchain”探索。
项目介绍
Aser …
AstrBot:一站式多平台智能聊天机器人框架,让开发者专注对话体验
在AI大模型还没流行的时候,我就一直在折腾各种智能客服和群聊机器人,踩过的坑数不胜数。
每换一个平台就要重新适配接口文档,写一堆重复的 if/else;大模型一升级,原来的 prompt 全部要重写;日志分散在不同服务器,排查一次问题就像&…
Codexia:开源桌面级 AI 编程助手,搭配GPT-5-Codex让你的开发效率瞬间开挂
从 GitHub Copilot,到后起之秀 Cursor、Claude Code。但它们大多只是编辑器内的智能补全,在完整的开发体验上,总让我觉得少了点什么。现在GPT-5-Codex来了!
最近我发现了一个开源项目 Codexia,它让…
Bytebot:开源AI桌面代理(Desktop Agent),给AI配一台自己的电脑
最近我刷到一个非常有意思的开源项目 —— Bytebot。说白了,它就是给AI装了一台属于它的“虚拟电脑”,然后让它像一个虚拟员工一样替你处理各种任务。
我第一反应是:这东西跟平时看到的&ld…
VoxCPM:开源声音克隆TTS神器,0.5B 逼真的语音克隆
最近我刷开源项目时,看到面壁团队(OpenBMB)放出了一个非常炸裂的开源工具 VoxCPM:一款 无需分词器的端到端语音生成(Tokenizer-Free TTS)模型,主打两个能力:
上下文感知的自然语音生成和逼真的零样本声音克隆
Vo…
TEN Framework:几分钟就能搭建Voice Agent 的AI 语音框架,开源GitHub 热榜第一
在过去两年,AI 大模型的浪潮让大家习惯了和 AI 用文字对话——写报告、写代码、甚至头脑风暴。但如果我们把视角放到更真实的场景,其实人类最自然、最高效的交流方式,依然是语音。每天有数十亿人通过说话产生信息,这些数据…
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
在体验各种 AI 和开源小工具的过程中,我经常会遇到这样的痛点:视频资源越来越多,手机和电脑的存储空间却越来越紧张。尤其是高清大片、网课教程、录屏素材,一个文件动辄几百 MB 甚至几个 GB,没几天存储就“爆仓”。
…
DocsGPT:给文档接入大模型秒变智能问答神器,让你告别翻文档的痛苦
在工作中,我们每天都要和各种文档打交道:项目文档、API说明、需求手册、学习笔记……但实际体验往往是“找不到、看不懂、效率低”。尤其当文档体量庞大时,传统的 Ctrl+F 搜索已经不够用。…
Serena:让 Claude Code 拥有 IDE 级别的代码理解与编辑能力
作为一个常年折腾各种 AI 工具和开源项目的独立开发者,我经常遇到这样一个问题:LLM 写代码的时候,总是依赖全文搜索/替换,结果就是费 token、费钱,还容易出错。
直到我接触到 Serena 这个项目,它直接改变了 Claude Co…