#开源

MinerU2.5-Pro 发布:1.2B 参数开源文档解析模型,OmniDocBench 得分 95.69 超越 Gemini 3 Pro
近期,OpenDataLab 团队发布了最新的文档解析模型(PDF-to-Markdown)——MinerU2.5-Pro。该模型实现了"小尺寸,高精度"。模型参数量仅有 1.2B,但在权威 OmniDocBench…
PilotDeck 开源 AI Agent 操作系统:一个人指挥一支智能体军队
PilotDeck 是由清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9stars 联合研发并开源的通用多任务 AI Agent 操作系统。它的核心理念是:一个人,一支智能体军队。每个项目拥有独立的工作舱 WorkSpa…
pyVideoTrans 开源视频翻译工具:语音识别+翻译+配音+声音克隆一站式解决方案
pyVideoTrans 是一款功能强大的开源视频翻译工具,由开发者 jianchang512 维护。 它在 GitHub 上已获得 17.6K Star,核心目标是将视频从一种语言无缝转换为包含另一种语言配音和字幕的视频,集成了语音识别、…
Qwen3.6-35B-A3B-Uncensored:35B参数仅3B激活的完全解锁开源MoE模型
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive 是一个基于 Qwen3.6 MoE 架构的去审查开源模型,由 HauhauCS 制作。该模型在 465 个测试案例中实现了 0 次拒绝,在 Hug…
开源纯真IP库在线查询系统:IP地理位置查询、本机IP查询、域名解析
ip-query-web 是一个基于纯真 IP 数据库(qqwry.ipdb)的 IP 地理位置在线查询系统,支持 IPv4/IPv6 双栈双库查询。全程由 AI 辅助开发,提供 RESTful API 接口,方便集成到各类应用中。 核心功…
腾讯混元 Hy-MT2 翻译模型:自定义风格翻译,比 Gemini 3.1 Pro 差多少?
腾讯混元开源了翻译模型 Hy-MT2,提供自定义翻译风格和指令功能。经过实际测试,它在学术论文、法律合同、新闻报道等专业场景的翻译质量明显优于通用翻译工具,最小的 1.8B 版本压缩后仅 440MB,可在 iPhone 上离线运行。 核心能…
MiniCPM5-1B 开源:1B 参数的端侧 AI 桌宠
MiniCPM5-1B:1B 参数的端侧基座模型,AA 榜单 2B 以下最强 5 月 25 日至 29 日,面壁智能与 OpenBMB 联合举办「端侧大模型开源周」,每天发布一个端侧大模型的关键能力。第二弹推出的 MiniCPM5-1B 是…
garden-skills:25 种风格配方解决 AI 前端审美同质化,6.2K Star 的 Agent Skills 集合
现在随便刷到的 AI 站点,几乎都是那套千篇一律的蓝紫渐变、圆角卡片、悬浮动效,仿佛从同一个模板里批量生产出来的。这种"AI 味"界面看多了难免审美疲劳,但作为开发者,又不得不承认 AI 确实提升了工作效率。 这就引出了一个有意思的矛盾:我…
OpenHarness:港大开源轻量级 Agent 基础设施,兼容 15+ 大模型提供商
OpenHarness:港大开源轻量级 Agent 基础设施,兼容 15+ 大模型提供商 AI Agent 领域概念层出不穷,但真正能在生产环境落地的基础设施依然稀缺。从工具调用到权限管理、从记忆持久化到多智能体协作,每一步都充满挑战。 近…
DeepSeek Reasonix:开源终端 AI 编程代理,前缀缓存让成本降低 70%
DeepSeek Reasonix:开源终端 AI 编程代理,前缀缓存让成本降低 70% 今天 Hacker News 上有一个项目直接爆了——616 分,评论 200+,把其他话题远远甩在后面。它就是 DeepSe…