10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

一文读懂Qwen3 全系 17 款模型,本地与云端的选择与部署建议

4月前 AI最新动态 524 0

 这篇文章一次性梳理 Qwen3 系列的全部 17 款模型:从首发到迭代、从旗舰到轻量、从通用到编码,并给出本地与云端的选择与部署建议。

Qwen3 系列发展路线图

第一阶段:首发(2025 年 4 月 29 日)

阿里推出 Qwen3 家族首批 8 款模型,覆盖多档 GPU 要求:

  • MoE(专家混合)模型 2 款:Qwen3-235B-A22B、Qwen3-30B-A3B
  • Dense(致密)模型 6 款:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B

其中 Qwen3-235B-A22B 表现最优:在多项评分中超越 DeepSeek-R1、Qwen32B、OpenAI-o1;与 Gemini-2.5-Pro 的对比中各有胜场,官方给出了详尽对标数据。

Qwen3-30B-A3B 相较上一代 Qwen32B 同样全面升级。

综合官方评测,首批 8 款模型的整体排序大致为:Qwen3-235B-A22B > Qwen3-32B > Qwen3-30B-A3B > …

本地部署建议:24G 显存可运行 Qwen3-32B 与 Qwen3-30B-A3B 的量化版本。

第二阶段:旗舰升级(2025 年 7 月 21 日—8 月 8 日)

Qwen3 迎来六款升级模型,覆盖三条主力尺寸,分别提供 Instruct(非思考)与 Thinking(思考)两种模式:

  • Qwen3-235B-A22B-Instruct-2507、Qwen3-235B-A22B-Thinking-2507(基于上一代旗舰 235B 的升级,新的旗舰)
  • Qwen3-30B-A3B-Instruct-2507、Qwen3-30B-A3B-Thinking-2507(30B 系列的全面升级)
  • Qwen3-4B-Instruct-2507、Qwen3-4B-Thinking-2507(4B 轻量型号的双模式升级)

性能要点:

Qwen3-235B-A22B-Instruct-2507 对比开闭源同类,官方评测显示优势明显,可谓“遥遥领先”。

Qwen3-30B-A3B-Thinking-2507 在多数场景超过上一代 Qwen3-235B-A22B 的思考模式表现。

Qwen3-30B-A3B-Instruct-2507 对上一代 Qwen3-235B-A22B 的非思考模式实现全面且显著的超越。

本地部署建议:24G 显存最高可运行 Qwen3-30B-A3B-Instruct-2507 与 Qwen3-30B-A3B-Thinking-2507 的量化版本。

此外,Qwen3 还提供两款垂直编码模型:

  • Qwen3-Coder-480B-A35B-Instruct
  • Qwen3-Coder-30B-A3B-Instruct

第三阶段:超旗舰预览(2025 年 9 月 5 日)

阿里发布当前系列最强模型 Qwen3-Max-Preview,预计很快会推出正式版 Qwen3-Max。该模型参数量达 1 万亿,是同系列 Qwen3-235B-A22B 的四倍。

官方评测显示,Qwen3-Max-Preview 在多个维度超越 Qwen3-235B-A22B-Instruct-2507 / Kimi K2 / Claude Opus4 / Deepseek-V3.1。

目前可在 https://chat.qwen.ai/ 免费体验。


选型与部署:远程与本地怎么选?

  • 远程使用:优先选择 Qwen3-Max-Preview。
  • 本地使用(24G 显存):推荐 Qwen3-30B-A3B-Instruct-2507 或 Qwen3-30B-A3B-Thinking-2507 的量化版本。

本地部署步骤(基于 Ollama)

  1. 先安装 Ollama
  2. 到 Ollama 官方库选择合适显存的模型:https://ollama.com/library/qwen3
  3. 下载过程中若速度突然变慢,可 Ctrl+C 终止;随后用下方命令继续(会从断点续传):
ollama run qwen3:30b-a3b-thinking-2507-q4_K_M

说明:若本地尚未下载该模型,上述命令会先拉取模型,再自动启动运行。

快速自测示例

>>> 0.8和0.11谁大
0.8 比 0.11 大。

解释:

  • 0.8 可写作 0.80,便于对齐比较。
  • 比较小数位:0.80 的十分位是 8,0.11 的十分位是 1,故 8 > 1。
  • 分数视角:0.8 = 80/100,0.11 = 11/100,显然 80/100 > 11/100。

结论:0.8 > 0.11。

相关资源

  • Qwen3 Github
  • Qwen3官方博客
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:一文读懂Qwen3 全系 17 款模型,本地与云端的选择与部署建议
#Qwen3 #模型部署 
收藏 1
告别手工抓取:用 OpenClaw + Playwright 让 AI 稳准提取网页内容
手把手教你部署 OpenClaw + Ollama + GLM-4.7-Flash 的纯本地方案,实现无需服务器、无模型调用费用、离线可用的 AI 助手
推荐阅读
  • 谷歌确认今年内发布 Gemini 3,但时间可能顺延
  • 开工速览:OpenClaw(小龙虾)的前世今生
  • Anthropic点名三家中国AI公司涉蒸馏攻击,马斯克反击:你们也不干净
  • 美团 LongCat 全新上线 AI 生图系列模型「LongCat-Image」!精准高效,AI 创作不设限
  • 各大平台免费 AI 大模型 + API汇总
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
28068 9月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
25847 11月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
17461 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
17291 12月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15240 1年前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13836 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
13740 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13697 12月前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
12631 9月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
11532 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
2 1-bit Bonsai 8B 大模型详解:8B 参数压缩至 1.15GB,手机也能跑 AI
3 Hermes 接入 Kimi K2.6 实测:SOTA 代码能力深度评测,不限流但推理速度慢
4 Claude 身份验证政策详解:Anthropic 新规对中国用户的影响与应对
5 完整解读:斯坦福 AI 年度报告 2026|423 页 15 条核心要点
6 OpenClaw 2026.04.14 更新:修复日常体验问题,稳定性优先
7 Hermes Agent 2026.04.13 更新
8 MiniMax M2.7 升级避坑指南:99% 的人漏了这步关键配置
9 skill-creator 2.0 详解:从提示词工具到工程平台的蜕变
10 腾讯正式发布面向 Agent 设计的命令行工具:CloudBase CLI V3
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联