#AI

开源Agent Reach:给AI Agent一键装上互联网,10+平台全网读取免费可用
今天聊的这个项目叫 Agent Reach。一句话定位:它给你的 AI Agent 装"眼睛",让 Claude Code、OpenClaw、Cursor 这些 Agent 一句话就能读推特、搜 Reddit、看 YouTube、刷小红书、…
Hermes Agent上线MoA功能:多模型混合协作,基准测试超越GPT-5.5和Opus-4.8
前几天 OpenAI 官方发布了 GPT-5.6 模型,但由于美国政府限制,我们暂时还用不了。不过,Hermes Agent 同时上线了一个很有意思的功能——MoA(Mixture of Agents,多模型混合):…
2026年不再需要学Agent开发:工作流脚本化才是普通人的AI护城河
今天看到一篇文章说"2026年,普通人已经不需要学习Agent开发了"。这个观点我基本同意,但想聊得更深一点。 Agent开发的黄金窗口已经关闭 过去两年,我们见过太多"Agent开发教程"——从 LangChain…
企业级知识库构建指南:从文档堆到可信知识底座,10步落地RAG系统
很多团队说要做知识库,最后往往做成了共享盘、Wiki 或者一个"能搜的文档堆"。这些工具当然有用,但当你希望它能稳定支撑团队协作、甚至接入 AI 问答(RAG)时,就必须重新定义:工程语境里的知识库不是文件的集合,而是一套面向检索与复用的信…
AI编程的瓶颈不是Prompt:从会用工具到管理工作流的认知跃迁
今天看到一篇文章的导读,标题很有意思:"你和 AI 写代码之间,差的不是 prompt,是一套工作流"。这句话说到点子上了。 Prompt 的幻觉 很多人刚开始用 AI 编程的时候,都会经历同一个阶段:觉得问题出在 prompt 不够好。今…
开源FigEdit:AI图片一键转可编辑PPTX/SVG,17个案例实测还原度90%+
最近终于解决了一个头疼很久的问题——AI 生成的图片无法编辑。 经常用 GPT Image 2、Nano Banana 的朋友都知道,无论是图片流 PPT、信息图、技术架构图还是论文配图,做出来可能就一句话的事,但修…
VoxFlow Studio:一站式AI语音生成平台,支持TTS/克隆/播客/多语言配音
今天发现一个很有意思的 AI 语音平台——VoxFlow Studio。它把 TTS(文本转语音)、声音克隆、播客生成、视频配音、幻灯片制作全部整合到一个平台里,支持 5 种语言、200+ 种预设声音,还能在 10 …
GPT-5.6 宣而不发,Fable 5 归来再禁:出口管制下的模型封锁
OpenAI 发布了迄今最强的模型——GPT-5.6,一口气推出三个型号:Sol、Terra、Luna,灵感来自太阳、地球、月亮。OpenAI 的命名规则也由此确立:数字管代际,名字管档位。 Sol 是旗舰,最贵也…
千问输入法正式上线:阿里双输入法赛马,语音输入成新战场
阿里在输入法赛道上又落了一子。刚刚上线的千问输入法(macOS 版),才是阿里集团层面的正式产品——而非此前引发讨论的 CosyVoice 输入法。两款输入法由阿里旗下不同公司运营,前后一两天内相继上线,形成内部赛马…
hlwy-ai-checker:用统计指纹检测第三方 AI API 是否掺水
第三方 AI API 市场水很深——号称提供 GPT-4、Claude 的渠道,实际背后可能用的是更便宜的模型。开源项目 hlwy-ai-checker 提供了一种检测思路:通过分析大模型在生成"随机数"时的统计指纹…