4月29日,阿里云Qwen3今日正式发布,全部开源8款混合推理模型。 开源包括Qwen3-235B-A22B(总参数超过2350亿元)两个MoE模型以及Qwen3-30B-A30多亿激活参)B(300亿总参数,30亿激活参数);还有六个Dense模型:Qwen3-32BB、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。 全球开发者、研究机构和企业可以免费下载模型并在魔术社区、HugingFace等平台上商用,支持Apache2.0协议开源,也可以通过阿里云百炼调用Qwen3API服务, 个人用户可以通过通义APP直接体验Qwen3,夸克即将全线接入Qwen3。 Qwen3 模型支持 119 语言和方言。 Qwen3 模型支持两种思维模式:1:1. 思维模式适用于需要深入思考的复杂问题。2.. 非思维模式适用于速度要求高于深度的简单问题。这种灵活性使用户能够根据特定的任务控制模型进行“思考”。这两种模式的整合大大提高了模型对稳定高效的“思维预算”的控制,使用户更容易为不同的任务配备特定的预算,实现成本效率与推理质量的更好平衡。 据介绍,旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中表现出了与众多顶级模型相比的极具竞争力的结果。性能超OpenAI-o1、DeepSeek-R1等大型模型。 Qwen3-30B-A3B的激活参数为QwQ-32B10%,表现更好, Qwen3-4B 这样的小模型也可以匹配 Qwen2.5-72B-Instruct 的性能。 对于部署,阿里云推荐使用 SGLang 和 vLLM 等框架;对于本地使用,如 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也值得推荐。 (责任编辑:admin) |