#模型

WorkBuddy 取消签到积分后,本地 AI 部署的 7 个真实场景与翻车案例
2026 年 5 月 10 日起,WorkBuddy 将取消每日签到积分。对于依赖签到获取免费积分的用户来说,这意味着每月的基本使用额度将大幅减少。 面对这一变化,越来越多的用户开始转向本地部署 AI 模型。本文分享本地运行 AI 的 7 …
Claude 桌面版支持第三方模型:Cowork 和 Code 模式全面开放
Anthropic 的 Claude 桌面版(Mac)正式支持第三方模型接入。这意味着即使没有 Claude 账号,也可以通过配置第三方 API 来使用 Claude Desktop 的全部功能,包括 Cowork(AI Agent)和 C…
GPT-5.5 与 DeepSeek V4 同日发布:价格 8.5 倍差距背后的 AI 格局变化
2026 年 4 月 24 日,是 AI 史上值得记录的一天。OpenAI 发布了 GPT-5.5,同一天 DeepSeek 发布了 V4。两家公司选择同一天亮剑,结果全网的目光被中国这家不怎么打广告的公司抢走了。 更关键的是:同一天发布的…
DeepSeek V4 发布:两款模型怎么选,以及怎么接入 API?
2026 年 4 月 24 日,DeepSeek 发布了 V4 系列模型,引发广泛关注。这次主要发布了两款模型:DeepSeek V4 Pro 和 DeepSeek V4 Flash,均支持 100 万上下文、开放权重,并提供 API 服务…
七牛云上线 DeepSeek-V4-Flash 和 DeepSeek-V4-Pro,而且能白嫖 5 款大模型 千问、GLM、Longcat 等
七牛云 AI 平台近期上线了一批完全免费的大模型,涵盖通用对话、深度推理、编程开发和 Agent 构建四大场景。对于想低成本尝试多种模型的开发者来说,这是一个值得关注的机会。 苏米注:七牛云这个 AI 平台其实已经做了一段时间,之前主要是存…
国内大厂CodingPlan/TokenPlan 套餐对比:阿里腾讯字节百度智谱 MiniMax 最新价格
摘要:本文详细介绍国内六大厂(阿里、腾讯、字节、百度、智谱、MiniMax)的 CodingPlan/TokenPlan 套餐费用、限制及可用模型。4 月底最新数据,帮助开发者选择合适的 AI 编程套餐。 国内各大厂的按次 CodingPl…
GPT-5.5正式发布:全面超越 Claude Opus 4.7,重新夺回 SOTA 宝座
摘要:OpenAI 正式发布 GPT-5.5,官方定义为"面向真实工作的全新智能类别"。在编程、知识工作、科学推理等多个维度全面超越 Claude Opus 4.7,重新夺回 SOTA 宝座。 本文整合多方信源,详解 GPT-5.5 的核心…
Qwen3.6-27B 实测报告:本地模型跑出 GPT-4 水准,27B Dense 架构超越 397B MoE
阿里发布了 Qwen3.6-27B,27B 参数的 Dense 架构模型(不是 MoE),原生支持 262K 上下文,Apache-2.0 开源。 苏米注:Dense 架构相比 MoE 部署更简单,不需要考虑路由问题,推理更稳定。这是本…
llmfit 开源工具:一键检测你的电脑能跑哪些本地大模型
今年以来,OpenClaw、Hermes 这些 Agent 工具接连爆火,但 Token 消耗快得吓人,只是对话几次、简单设置个任务,一天就烧掉几十块。于是越来越多人把目光转向了本地模型部署,既省钱又能离线使用。 苏米注:但真动手的时候,…
Gemma 4 + TurboQuant:Google开源模型新方案,本地部署 LLM 内存降低 83%
在过去三年里,很多人认为模型越大越"聪明"。他们觉得参数越多性能越好,GPU 越多就越强。这个普遍认知本周被 Google 的开源模型 "Gemma 4" 彻底颠覆。 Gemma 是 Google 发布的一系列 open-weight 模型…