摘要:本文详细介绍国内六大厂(阿里、腾讯、字节、百度、智谱、MiniMax)的 CodingPlan/TokenPlan 套餐费用、限制及可用模型。4 月底最新数据,帮助开发者选择合适的 AI 编程套餐。
国内各大厂的按次 CodingPlan 有点扛不住,都转成按量的 TokenPlan 了。Token 翻译过来叫"词元",但叫"算力币"更贴切点。
下面介绍阿里、腾讯、字节、百度、智谱、MiniMax 的 CodingPlan / TokenPlan 费用及限制。
百炼 CodingPlan/TokenPlan(阿里云)
CodingPlan
阿里云的 CodingPlan 计划,40 元每月的 Lite 版已经不能购买和续费了,现在 200 元/月的 Pro 套餐每天放量也不多,每天 9:30 开抢,听说还有封号比较多,感觉过不了多久也要下架了。

TokenPlan
TokenPlan 是新推出来的,是按量来计算的套餐。

虽然使用的是 Credits,但与 Token 量有直接挂钩。以 qwen3.6-plus 为例,预估单次请求消耗明细如下:
| Token 类型 | 数量 | 消耗 Credits |
|---|---|---|
| 输入 tokens | 8,349 | 1.67 |
| 缓存 tokens | 40,794 | 1.63 |
| 输出 tokens | 573 | 0.69 |
| 合计 | - | 约 4 Credits |
苏米注:如果给 OpenClaw 或 Hermes 用,200 元的 CodingPlan 优势大于 198 的 TokenPlan,主要是 AI 智能体输入量太大,按次划算。
可用模型
- 推荐:Qwen3.6-Plus(图文)、Kimi-K2.5(图文)、GLM-5、MiniMax-M2.5
- 其他:Qwen3.5-Plus、Qwen3-Max、Qwen3-Coder 系列、GLM-4.7 等
使用体验
200 元/月的 CodingPlan,输出比较稳定,即使在高峰期,平均响应时间在 10 秒内,个别复杂一点的在 30~60 秒有响应。
腾讯云 TokenPlan
腾讯云的 CodingPlan 一直显示售罄,基本也转用 TokenPlan 了。
TokenPlan

直接按 Tokens 计费。
可用模型
- Auto 模型(系统智能路由)
- 腾讯混元系:Tencent HY 2.0 Instruct、Tencent HY 2.0 Think、Hunyuan-T1 等
- 三方模型:MiniMax-M2.5、MiniMax-M2.7、GLM-5、GLM-5.1、Kimi-K2.5
方舟 CodingPlan(字节跳动 / 火山引擎)
火山引擎的 CodingPlan 可以直接购买,网上有评论说高峰期反应迟钝等。

可用模型
- 豆包系:Doubao-Seed-2.0-Code、Doubao-Seed-2.0-pro、Doubao-Seed-2.0-lite、Doubao-Seed-Code
- 三方模型:MiniMax-M2.7、MiniMax-M2.5、Kimi-K2.6、Kimi-K2.5、GLM-5.1、GLM-4.7、DeepSeek-V3.2、Doubao-Embedding-Vision 等
使用限制
| 套餐 | 每 5 小时 | 每周 | 每月 |
|---|---|---|---|
| Lite | 1200 次 | 9000 次 | 18000 次 |
| Pro | 6000 次 | 45000 次 | 90000 次 |
千帆 CodingPlan(百度)
百度千帆 CodingPlan 现在也可以直接购买。

可用模型
- GLM-5、Kimi-K2.5、MiniMax-M2.5、DeepSeek-V3.2 等 4+ 款
使用限制
| 套餐 | 每 5 小时 | 每周 | 每月 |
|---|---|---|---|
| Lite | 1200 次 | 9000 次 | 18000 次 |
| Pro | 6000 次 | 45000 次 | 90000 次 |
智谱 CodingPlan
智谱的 CodingPlan 有三个档次,但基本比较热门,售罄没货,每天 10 点补货。网上有人说会有超时情况。

可用模型
- 只支持自家模型:GLM-5.1、GLM-5-Turbo、GLM-4.7、GLM-4.5-Air 等
使用限制
| 套餐 | 每 5 小时 | 每周 |
|---|---|---|
| Lite | 约 80 次 prompts | 约 400 次 prompts |
| Pro | 约 400 次 prompts | 约 2000 次 prompts |
| Max | 约 1600 次 prompts | 约 8000 次 prompts |
说明:一次 prompt 指一次提问,每次 prompt 预计可调用模型 15-20 次。额度在请求消耗 5 小时后刷新重置。
MiniMax TokenPlan
MiniMax 的 TokenPlan 计划是按次计算的,分为正常版和极速版本,唯一的区别是响应速度不一样。

可用模型
- 只支持自家模型:MiniMax-M2.7、MiniMax-M2.5 等
标准版
| 功能 | Starter | Plus | Max |
|---|---|---|---|
| M2.7 | 600 次/5 小时 | 1,500 次/5 小时 | 4,500 次/5 小时 |
| Speech 2.8 | - | 4,000 字符/日 | 11,000 字符/日 |
| image-01 | - | 50 张/日 | 120 张/日 |
| Hailuo-2.3-Fast 768P 6s | - | 2 个/日 | 2 个/日 |
| Music-2.6 | 100 首/天 | 100 首/天 | 100 首/天 |
极速版
| 功能 | Plus-极速版 | Max-极速版 | Ultra-极速版 |
|---|---|---|---|
| M2.7-highspeed | 1,500 次/5 小时 | 4,500 次/5 小时 | 30,000 次/5 小时 |
| Speech 2.8 | 9,000 字符/日 | 19,000 字符/日 | 50,000 字符/日 |
| image-01 | 100 张/日 | 200 张/日 | 800 张/日 |
| Hailuo-2.3-Fast 768P 6s | - | 3 个/日 | 5 个/日 |
| Music-2.6 | 100 首/天 | 100 首/天 | 100 首/天 |
选型建议
苏米注:根据实际使用场景,建议如下:
- AI 智能体重度用户(OpenClaw/Hermes):优先选择阿里云 CodingPlan(按次更划算)
- 轻度使用者:TokenPlan 按量计费更灵活
- 追求稳定性:阿里云、腾讯云相对成熟
- 追求性价比:字节、百度价格更有优势
- 需要多模态:MiniMax 支持语音、图片、视频生成
总结
国内大厂的 AI 套餐正在从按次(CodingPlan)向按量(TokenPlan)转型。对于 AI 智能体用户来说,按次套餐在输入量大的场景下更划算;对于普通开发者,按量套餐更灵活。
参考资料:
- 阿里云百炼:https://bailian.console.aliyun.com/
- 腾讯云:https://cloud.tencent.com/
- 火山引擎:https://www.volcengine.com/
- 百度千帆:https://cloud.baidu.com/
- 智谱 AI:https://open.bigmodel.cn/
- MiniMax:https://www.minimax.io/