#AI

HTML版剪映来了:OpenDesign团队开源HTML-Video
OpenDesign 团队(nexu.io)近日释出了「html-video」项目,号称 HTML版剪映,完全开源。 项目核心特点 基于 hyperframes 框架构建。采用 Apache 2.0 开源协议,由 Open Design…
Codex++ 开源:让 OpenAI Codex 接入国产大模型,告别 ChatGPT 订阅
Codex 是 OpenAI 官方的编程智能体桌面应用,补全、改 Bug、读项目、跑 Agent,体验确实出色。但用过的人都清楚它的几个痛点: 要么需要 ChatGPT 订阅,要么烧 OpenAI API,对个人开发者不够友好 需要海外账…
37 个精选 AI 开源项目清单:Agent、编程、设计全覆盖
最近几个月,GitHub 上涌现了大量 AI 开源项目,多到让人产生「信息焦虑」。每天刷 Trending 就要花半小时,社群里也频繁有人分享新项目。Agent、Skills、MCP……概念一波接一波,到底哪些是…
腾讯元宝高考通发布:AI辅助志愿填报,覆盖冲稳保三梯度方案
6 月高考季,志愿填报一直是考生和家长的痛点。分数刚出来那几天,全家焦头烂额查学校、翻资料、找专家,生怕填错一个志愿就浪费了几十分。 近日,腾讯元宝和 QQ 浏览器联合发布了「元宝高考通」,号称行业首个高考咨询师 Agent。 核心功能 …
微信 A2A 能力正式上线:语音操控,双手自由
近日,微信推出了一项备受期待的功能——A2A(Agent-to-Agent)能力正式上线。用户只需通过语音指令,就能让手机自动打开微信,完成发消息、打语音、打视频等操作。 比如,你可以直接说:"打开微信给老谢发消息,…
Claude Code Dynamic Workflows:从 Prompt 到 Loop 的 AI 编程范式转变
Claude Code 作者Boris 近期表示:"我现在不再给 Claude 写 prompt 了,我有一堆 loop 在跑。我的工作是写 loop。"他通过一次演讲,分享了自己日常使用 Claude Code 的配置和工作方式。 An…
谷歌开源 Gemma 4 12B:统一无编码器架构,16GB 内存笔记本即可运行多模态模型
谷歌 DeepMind 发布了 Gemma 4 12B 模型。该模型将多模态智能能力集成到轻量级架构中,可在消费级笔记本电脑上运行。 Gemma 4 12B 填补了 Gemma 系列的关键空缺:比边缘端的 E4B 更强,比 26B 混合专…
Kimi Work 桌面 Agent:支持 300 个 Agent 并行,实现网页数据抓取与分析
Kimi 发布了桌面端的 Kimi Work 产品,定位为"面向知识工作者的桌面 Agent 产品",支持最多 300 个 Agent 并行工作。 核心能力包括: WebBridge 浏览器操控 同花顺/天眼查/iFind 等专业数据源接…
Codex Claude Code /goal 长时间运行指南:解决自动停止问题
Claude Code 和 Codex 的 /goal 功能已经推出一段时间。这个号称能让 AI "长时间自主运行直到目标完成"的功能,实际使用效果却差异巨大:有人能让 AI 连续运行几十小时完成复杂任务,有人却遇到跑一会儿就停止的情况。…
WorkBuddy 三大新功能:连接器、专家团、灵感,重塑 AI 助手体验
WorkBuddy 是一个桌面 AI 助手。三个月前,它给人的感觉是"还可以"——一个能聊天的工具。但最近两个月的更新让它从"可以用"变成了"离不开"。现在的 WorkBuddy 不再等待指令,而是开始理解任务、拆解…