当前位置：首页 » AI开源项目

Liquid AI 发布手机级推理模型：LFM2.5-1.2B-Thinking，900MB 内存即可跑通

1小时前 AI开源项目 18 0

最近在浏览开源模型时，我注意到Liquid AI发布的LFM2.5-1.2B-Thinking引起了不少讨论。

作为一名长期关注AI落地的产品经理，我对这类"轻量化推理模型"特别感兴趣——它们正在改变AI应用的部署逻辑。

与其说这是一次模型发布，不如说它标志着设备端推理从概念走向可用的一个节点。让我详细拆解一下这个项目的实际价值。

项目核心定位

LFM2.5-1.2B-Thinking是一个完全设备端运行的推理模型。其核心特征是：

性能表现对比

为了理清这个模型的实际能力，我整理了几个关键基准的改进数据：

能力维度	基准测试	LFM2.5-1.2B-Thinking	变化幅度
数学推理	MATH-500	88分	↑ 25分（相对指令版）
指令遵循	Multi-IF	69分	↑ 8分
工具使用	BFCLv3	57分	↑ 8分

推理性能指标

设备端推理的关键指标是解码速度和内存占用。我对比了几个代表性平台的实测数据：

桌面CPU环境（AMD Ryzen 9 3950X）：237 tok/s，内存占用853MB

对标Granite-4.0-H-1B：147 tok/s（快60%）

对标Qwen3-1.7B：122 tok/s（快94%）

移动端芯片（高通骁龙8 Elite）：70 tok/s，足以支撑实时交互

这个速度标志着本地手机推理从理论可行走向实际可用的分界点

应用场景

基于上述特征，这个模型适合以下场景：

技术架构

模型采用混合架构设计：

部署和集成

开源生态支持相对完善：

模型家族生态

Liquid AI的LFM系列包含多个变体，覆盖不同应用需求：

这种分层设计让不同业务需求的团队都能找到相应的模型版本。

相似项目对标

如果你对类似项目感兴趣，以下几个项目值得关注：

总结与思考

从产品经理的视角，我认为LFM2.5-1.2B-Thinking的意义不在于"最强"或"最优"，而在于它成功跨越了一道门槛——让设备端推理从演示案例变成可部署方案。

几个关键观察：

如果你的产品涉及离线推理、隐私保护或成本优化，这个项目值得深入评估。它代表的不仅是一个具体的模型选择，更是AI应用架构的一种可能演进方向。

相关资源

Hugging Face模型卡：https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

请登录后发表评论

文章目录