#AI
Claude Code 新增子代理并行功能:拆任务、多线跑、统一校验,效率大幅提升
Claude Code 迎来了一个重要更新:它现在支持“分身”能力了。
核心变化:Claude Code 不再单线写代码,而是能够拆分任务、派发子代理并行执行,最后统一校验结果。
这意味着,当你给 Claude C…
小米开源 MiMoCode,5 人 14 天打造的 AI 编程 Agent,支持跨会话记忆与多 Agent 协作
如果 5 个人只有 14 天,能不能做出一款像 Claude Code 那样的终端编程 Agent?
小米 MiMo 团队给出的答案是:不仅做出来了,还直接把代码开源了。
这个新项目叫 MiMoCode,首个版本为 v0.1.0
官方定义为…
harness-anything:让 AI 直接操控 WPS、Photoshop 的开源桌面工具,47 个命令覆盖办公设计学术
最近在 GitHub 上发现了一个很有意思的开源项目——harness-anything,它把桌面软件的常用操作抽象成统一的命令行接口,让 AI 可以直接操控 WPS、Photoshop、Illustrator 等本…
BrowserAct:让 AI突破反爬虫检测的浏览器自动化 Skill
如何让 AI Agent 更好地操作浏览器,一直是一个没有完美解答的课题。最近 GitHub 上出现了一个叫 BrowserAct 的项目,专注于让 AI Agent 操作真实浏览器,突破反爬虫检测。
很多人第一反应是:这不就是 Codex…
HyperFrames 与 html-video:两个 HTML 生成视频的开源项目对比
用代码生成视频已经不是新鲜事了,但有两个 GitHub 项目走了一条不同的路——用写 HTML 的方式来做视频。不需要 React,不需要复杂的构建流程,一个 HTML 文件就是一个视频。
1. HyperFrame…
Google Gemini 3.5 Live Translate:70+语言实时同声翻译模型发布
Google 发布了实时语音翻译模型 Gemini 3.5 Live Translate,能在 70 多种语言之间做到边听边译,同时保留说话人的语调、节奏和音高。该模型基于 Gemini 3.5 架构,兼顾了 Gemini 3.0 Pro …
Codex 开源插件生态全解析:Expo、Remotion、Cloudflare 一键复用
很多人第一次打开 Codex,感觉只是又一个会写代码的 AI 工具。直到看到有人给它装了插件,才发现它能读设计稿、开发 iOS/Android 应用、2D/3D 游戏,能直接把 Notion 里的需求文档变成开发计划。没有插件的 Codex…
办公小浣熊桌面端2.0:比OpenClaw和Hermes更全面的AI办公助手
现在的 AI 工具各种 "claw" 满天飞,但有两件事一直没处理好:一是割裂,工具各做一块,完整任务得在它们之间来回搬运,每换一道工序掉一层信息;AI 待在云端,文件和应用却在本地,每次都得上传下载。二是没记性,今天交代清楚身份和文风,明…
DeepSeek-GUI深度体验:从想法到计划,AI项目管理新范式
最近在 X 上看到一个大佬开发的 DeepSeek-GUI(Kun),界面吸引了我,下载尝试后发现它最让我上瘾的功能不是代码补全,而是一个看起来不太起眼的东西——需求→计划→Todo 的链路。
聊…
JoyAI-Echo开源:京东5分钟长视频生成框架,角色不崩+对话式编辑
京东最近在 AI 视频赛道发布了 JoyAI-Echo,一个专为分钟级多镜头故事生成设计的长音视频生成框架。目前已在 GitHub 和 Hugging Face 全面开源。
JoyAI-Echo 直接针对 AI 长视频生成的三大核心痛点:角…