#arena
Qwen3.7 Preview 曝光:Arena Text 排名 13,Vision 排名 16
还没正式发布,就已经杀进了全球排行榜前 20。5 月 18 日,Qwen 官方推特 @Alibaba_Qwen 发布了一条低调的推文,配图里 Arena.ai 的排行榜上赫然出现了两个新名字:Qwen3.7-Max-Preview 和 Qw…
LMArena:这个大模型评测试用台,全免费!GPT-5.2、Claude 4.5、Gemini 3 随便用
作为一名常年跑新模型、做选型评测的产品经理,如果只把 LMArena 视为一个查看“公开模型对比平台”,那你就错了。
普通用户可以在这里薅羊毛。
你可以免费体验 GPT-5.2、Gemini 3 Pro、C…
LMArena AI:AI模型评估平台,AI大语言模型对战评测平台
LMArena AI,前身为lmsys.org,一个专注于众包AI基准测试的AI模型评估平台,由加州大学伯克利分校SkyLab和LMSYS研究团队打造。类似 V0 或者 Bolt 的平台,区别是你输入一个需求后会有两个模型给出代码并且会把…
Kimi K2 模型代码能力评测结果公开,Kimi K2超越DeepSeek拿下全球开源第一
开源第一,总榜第五,而且紧追GPT 4.5及马斯克Grok 4这样的顶尖闭源模型。
Kimi K2 发布有一段时间了,苏米之前也做过几期关于代码应用的分享,大家可以先回顾一下:
Kimi K2 发布体验:万亿参数能否成为Claude 4 平…