#AI

GLM-5.2 实测评估:DeepSeek 之上的复杂执行层模型,海外社区真实反馈
GLM-5.2 在海外 AI 圈子里突然很热。很多人说它很强,甚至有人拿来和 Claude、GPT 的顶级模型比较。国内模型每次发布都容易被质疑"是不是又在刷榜",所以这次没有只看官方宣传,而是翻了一圈海外用户的真实反馈:Hacker Ne…
Fable 5 暂停事件反思:AI 编程生产体系如何构建可替换的模型节点
Fable 5 被暂停那天,我第一反应是庆幸——庆幸自己没有把生产流程全押在它身上。 Fable 5 发布的时候,我认真研究了一下。它属于 Mythos-class,能力层级比 Opus 还高。Anthropic 官…
百度 DuMate :系统级 AI 助手,跨软件自动化处理办公任务
越来越离不开 Codex 这类 Agent 工具了——能直接理解项目、读取文件、自动拆任务、改内容。但订阅麻烦,Visa 卡不好办,拼车价格还涨到了 150 元。所以最近一直在找国内平替,挖到了百度的通用智能体:百度…
Headroom:AI Agent 上下文压缩工具,token 节省 60-95% 的开源方案
跑 Claude Code 改个稍大的项目,一个长任务下来几万 token 就没了。Codex 调试一段日志,光日志本身就把上下文吃掉一大半。更难受的是,这些 token 大部分都是垃圾信息——一百行 grep 结果…
Taste Skill:反 AI 味前端框架,让 AI 编程助手生成专业级设计界面
很多前端开发者都有同感:让 AI 生成 landing page,十份有八份是紫蓝渐变加大圆角、居中 Hero。间距、层级、字体比例"看起来能跑",但经不起细看。改来改去,还是在"像 AI 做的"和"像人设计的"之间反复横跳。 Taste …
PP-OCRv6 实测:34.5M 专用模型打败 235B 大模型?三档 OCR 对比评测
上个月我写了一篇 OCR 选型实测的文章,测试了 18 个文档、6 类场景,核心观点其实很简单:OCR 没有一个模型能通吃所有场景。规整的打印文本、手写笔记、表格、双栏排版的论文、带公式的文档——这些背后是完全不同的…
CodeX 自动化实战:3 个定时任务搞定竞品追踪、SEO 分析和宣传灵感收集
在使用 AI 编程工具的过程中,除了日常写代码和 Review,自动化任务可能是最被低估的功能之一。大多数人在对话框里和 Agent 交互,但"自动化"可以让 Agent 按定时计划持续执行重复性工作,比如竞品追踪、SEO 分析、宣传主题收…
GLM 5.2 开源详览:1M 上下文、744B MoE 架构与 Coding 实测
智谱 AI 近日正式开源 GLM-5.2,同步发布技术博客。该模型基于 744B MoE 架构(40B 激活),支持 1M 上下文,采用 MIT 协议开源。API 已全量上线,价格与 5.1 保持一致。 在 Coding 领域,GLM-5.…
Omnigent:Databricks 开源的多 Agent 管理平台,5 天获 3000 Star
AI 编程已经进入下半场。现在的焦点不再仅仅是拥有一个 Agent,而是如何高效管理越来越多的 Agent。 Claude Code 负责写代码,Codex 查资料,Cursor 改项目。表面上效率翻倍,实际上开发者每天都在不同窗口间切换。…
Marvis 实测:腾讯新出的 AI Agent 工具,能帮你操控电脑
腾讯近期推出的 Marvis 引起了不少关注。这款 AI Agent 工具实测下来,确实有点上瘾。它主打的是让普通人也能用懂 AI,甚至不需要写代码就能实现复杂的电脑操作。 Marvis 是什么 Marvis 的核心能力是「端侧本地模型…