AI最新动态

为您提供AI人工智能新闻,人工智能消息,人工智能动态,人工智能行业等人工智能行业资讯报道

字节又出狠活:免费开源的 DreamOmni2,让图像编辑变成一句话的事
字节推出新图像编辑器 DreamOmni2:免费、开源、本地可运行,够不够狠!!! 如果你以为这只是又一个“AI 画图工具”,那你真的低估了它。 我第一次上手时,感受更像是在和一个懂我语言的设计助手对话。 我随口输…
DeepSeek又一王炸开源:OCR 终结者登场!DeepSeek-OCR,重新定义AI视觉效率
刚刚,DeepSeek 团队突然丢出了一颗王炸级开源项目,名为上下文光学压缩(Contexts Optical Compression)的新技术,并且直接开源! 一句话总结,这东西可能会让传统的 OCR(光学字符识别)彻底失业。 因为它能…
对标 Sora 2,谷歌Veo 3.1悄悄上线,实测体验比想象更惊喜!
10月15号晚上,谷歌悄悄把自家的AI视频模型 Veo 3.1 放出来了。虽然官方没大肆宣传,但我第一时间就看到好几个平台同步更新了版本,忍不住上手体验了一轮。 我先说结论:Veo 3.1确实比上个版本进步明显,尤其是在画面和音效的同步上…
OpenAI发布AgentKit:让开发者构建、部署和优化AI Agent的过程变得超级顺滑。
最近我在OpenAI DevDay上看到Sam Altman发布了AgentKit,坦白说,第一时间我的反应是"这东西来得太及时了"。 作为一个一直在体验各类AI产品的产品经理,我见过太多开发者在构建AI Agent时面临的困境:要么得上手…
Google 重磅发布 Gemini Enterprise:智能体2.0时代正式开启,重新定义企业级AI Agent
Google 正式推出了全新的 AI 平台:Gemini Enterprise。 一句话总结我的感受:这不只是AI工具,而是一个“超级智能体操作系统”。 我知道,这几年我们都在玩各种「工作流自动化」:像 n8n、C…
Claude Code Plugins 插件系统上线:从代码生成器到可编程AI平台,支持添加自定义功能模块
最近 Anthropic 又悄悄放了一个大招 : Claude Code Plugins 插件系统上线。 这意味着,Claude Code 不再只是一个“写代码的AI助手”,而是开始进化成一个真正可编程的AI平台。 …
Gemini CLI 扩展正式上线,让命令行真正变成你的智能助手
Google 发布 Gemini CLI 扩展(Gemini CLI Extensions),让命令行成为一个真正智能的“中枢助手”,而不是冷冰冰的输入窗口。 现在的开发环境越来越分裂:打开一个 VS Code,要切…
Gemini 2.5 Pro再升级:推出专用计算机操作模型,智能体开始真正接管电脑操作
谷歌新发布的 Gemini 2.5 计算机使用模型(Computer Use Model) ,这是一款基于Gemini 2.5 Pro视觉理解与推理能力构建的专用模型,旨在赋予AI智能体(agent)与图形用户界面(GUI)直接交互的能力&…
OpenAI DevDay 2025:这不是发布会,而是下一代AI生态
这场 OpenAI DevDay,我反复看了两遍。坦白讲,朋友圈、B站、X 上到处都是“总结贴”,但几乎都停留在「列功能」层面。真正震撼我的,不是 GPT-5 的升级有多强,而是——OpenA…
智谱GLM-4.6 发布,国产最强模型上新,而且开源!
国庆节前狂欢!刚分享完Claude4.5、deepseekV3.2,GLM-4.6又发布了! 这是继 DeepSeek-V3.2-Exp 与 Claude Sonnet 4.5 之后,又一重大开源模型发布。 升级了什么? 智谱于9月30日正…