是的,我又来带大家白嫖大模型API了
不知道之前分享的几个你们都有用上了吗?
英伟达最近在 NIM 平台上,上线了两个国产模型:智谱 GLM-4.7 和 MiniMax M2.1。 很多人不知道这个消息,但接口已经开放。 更重要的是,免费!!
支持的免费模型:
-
minimaxai/minimax-m2.1
-
z-ai/glm4.7
-
deepseek-ai/deepseek-rl
-
gwen/qwen2.5-coder-32b-instruct
-
openai/gpt-oss-120b
-
google/gemma-3-27b-it
-
meta/llama-4-maverick-17b-128e-instruct
-
mistralai/devstral-2-123b-instruct-2512
-
超多免费模型使用……
不过重点就是 GLM-4.7 和 MiniMax M2.1 这两个我比较关注的模型。
这两个模型发布时间都很近。GLM-4.7 是智谱在 12 月底发布的版本,整体偏通用,风格比较稳。MiniMax M2.1 是同一周发布的,更强调推理和逻辑。
如果不懂是什么段位,那么直接看 WebDev Leaderboard 这个榜单,MiniMax M2.1 拿到 1448 分,排第六;GLM-4.7 是 1427 分,排第七。这个成绩,放在现在的模型环境里,对比前几名,已经可以说明实力了。

话不多说直接上实操:
第一步,注册开发者账号
打开 build.nvidia.com。

右上角点 Login,用邮箱注册。

设置密码之后,邮箱会收到一个 6 位验证码,填进去就行。

接着随便起个账户名,创建 NVIDIA Cloud Account。

这里有个很多人会卡住的点。 页面右上角会出现一个 Verify,一定要点。

需要用手机号验证,实测国内号码是可以的(注意步骤)。

验证完,这一步才算真正完成。

第二步,生成 API Key。
登录成功后,点右上角头像,找到 API Keys。

点击 Generate API Key。

给这个 Key 起个名字,过期时间最长是12个月

生成之后,这个Key一定要复制保存好。

第三步,接入Cherry Studio
这里用 Cherry Studio 举例
Cherry Studio 是一款开源的智能聊天工具,支持智能对话、自主 Agent,无缝集成 300+ 主流大模型,自由切换等特性。
如果用其他支持主流大模型 的工具逻辑也是一样的。
打开 Cherry Studio,右上角进设置。
找到模型服务 - 英伟达,填入Keys

默认模型只有英传达和LLM的模型,可以在管理搜索并添加

这里推荐直接加这几个:
-
z-ai/glm4.7
-
minimaxai/minimax-m2.1
-
moonshotai/kimi-k2-thinking
配好之后,记得检测一下:

提示连接成功就基本能直接用了。

GLM-4.7 因为我开了代码套餐,但不支持在像Cherry Studio这类工具上用 所以通过这个免费的API,也是能够满足日常轻度使用,比如跑Skill、跑提示词、当日常助手,问题不大。
拿来当 Claude 的平替,也完全够用。
不过如果你要用来开发,那应该是会被限的,现在智谱、MiniMax、Kimi 的 Coding Plan 定价都不算高,速度和稳定性明显会更好。
Ad Time
现在智谱的编码套餐活动还在,有需要的可以冲!

如果你想先试试,现在智谱开放了GLM Coding Plan 7天体验卡
因为只有开了套餐的用户才能邀请,而且只有7张,先到先得
