模型评测 - 苏米客

昨天 Kimi Code 悄悄推了一条通知：K2.6-code-preview 已上线，向所有订阅用户开放。今天我把 Hermes 里 23 个 Agent 全切了过去，跑了整整一天。结论先说：K2.6 目前是我用过的国产编程模型里最强的…

34

6小时前

作为一名常年跑新模型、做选型评测的产品经理，如果只把 LMArena 视为一个查看“公开模型对比平台”，那你就错了。普通用户可以在这里薅羊毛。你可以免费体验 GPT-5.2、Gemini 3 Pro、C…

853

2月前

AI产品百科

最近这半年，各大模型厂商密集发布新版本，从OpenAI、Anthropic到国内的GLM、Qwen，新模型层出不穷。问题随之而来：这些模型到底处于什么水平？性能、成本、推理速度如何权衡？如果你也有过这样的困惑，比如GLM 4.7发布后不…

3511

3月前

AI工具集合

#模型评测