当前位置：首页 » AI最新动态

实测美团LongCat-2.0：5万张国产芯片跑出的万亿参数MoE大模型

1小时前 AI最新动态 14 0

美团发布了 LongCat-2.0，一个总参数 1.6 万亿（激活约 480 亿参数）的 MoE 模型。值得瞩目的是，该模型从预训练到大规模部署，全程跑在 5 万张国产算力芯片上，耗时一个多月，处理超过 35 万亿 tokens，全程无回滚且无不可恢复的 loss 突刺。

这一成果的意义不仅在于性能，更在于它完整跑通了基于国产算力的大模型全链路。对于经常面临海外模型封号或限流风险的用户来说，LongCat-2.0 提供了一个开源、可 API 接入、能直接集成到 Claude Code 或 Codex 等工作流的国产替代方案。

虽然 LongCat-2.0 并非全面 SOTA（在 IFEval、GPQA-diamond 等通用能力上与 Gemini 3.1 Pro、GPT-5.5 仍有差距），但在 Agent 场景下表现突出：

核心技术：LSA 与 N-gram Embedding

为了让模型在长上下文和工具调用中保持稳定，LongCat-2.0 引入了两项关键技术：

1. LSA 稀疏注意力机制

面对超长输入时，模型不再逐字硬啃。LSA 使模型能够更有效地处理代码库阅读、文档翻阅和多步骤操作，解决 Agent 长上下文记忆和工具调用的稳定性问题。

2. N-gram Embedding

模型不再只关注单个 token，而是对词组组合的语义更敏感，提升了对局部语境的理解能力。

LongCat-2.0 兼容 OpenAI 和 Anthropic API 生态。只需更换 base_url 和 API key 即可接入现有工作流。

OpenAI 兼容接口：

base_url="https://api.longcat.chat/openai"
model="LongCat-2.0"
api_key=LONGCAT_API_KEY

Anthropic 兼容接口：

base_url="https://api.longcat.chat/anthropic"
model="LongCat-2.0"

将 LongCat-2.0 接入 Claude Code，测试其对杂乱工作文件夹的整理能力。模型首先读取目录结构，区分代码、文档、素材和测试文件，然后给出不破坏项目引用和运行逻辑的重组方案。

执行过程中，模型会先拆解整理原则，分阶段处理问题：先理解项目结构，再判断文件用途，最后结合多维度分析将文件夹还原为清晰的工作系统。

测试场景：联网搜资料 → 整理大纲 → 调用 Skill → 生成演示文稿。

LongCat-2.0 首先联网搜索官方文档，确认模型特点和适用结构，然后检查当前环境中的 Skills 能力。完成资料收集和工具盘点后，再进行整体规划并生成文稿内容。

生成的 PPT 内容连贯一致，从背景介绍到核心能力、测试过程和结论，没有出现典型的 AI 生成排版问题。

LongCat-2.0 最值得关注的价值在于：它是一个全程国产算力训练出来的万亿模型，直接落地到了开发者可用的位置。在当前海外模型频繁封号的背景下，看到国产模型能够开源、API 接入、接入真实工作流，无疑是一个积极的信号。

虽然基础能力离顶级闭源模型仍有差距，但至少在关键时刻，我们有了一个新的选择。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

请登录后发表评论