此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
目前,全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用,也可以通过阿里云百炼调用Qwen3的API服务。个人用户可立即通过通义APP直接体验Qwen3,夸克也即将全线接入Qwen3。
据介绍,Qwen3模型支持两种思考模式。在思考模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。在非思考模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。
此外,Qwen3模型支持119种语言和方言。