Qwen3
深入思考或快速行动
2025-04-29

Qwen3是阿里巴巴开源的最新大语言模型系列(0.6B到235B MoE)。其特色是可切换的"思考模式",以在推理与速度之间进行权衡。在代码和数学方面表现强劲。支持多语言。
Qwen3是阿里巴巴推出的最新开源大语言模型系列,提供从0.6B到235B参数不等的多种模型规模,包括密集型和混合专家(MoE)变体。其突出特点是可切换的“思考模式”,允许用户在编程和数学等复杂任务的深度推理与更快的通用聊天之间切换。该模型在支持超过100种语言的多语言能力方面表现卓越,并在基于代理的任务、创意写作和遵循指令方面展现出强大的性能。
通过Hugging Face和ModelScope等平台可用,Qwen3设计灵活,支持在CPU/GPU上本地部署,并能与Transformers、llama.cpp和vLLM等框架集成。它在之前的Qwen迭代基础上,增强了推理、对齐和工具使用能力。该模型采用Apache 2.0许可证,鼓励广泛采用和定制。
通过Hugging Face和ModelScope等平台可用,Qwen3设计灵活,支持在CPU/GPU上本地部署,并能与Transformers、llama.cpp和vLLM等框架集成。它在之前的Qwen迭代基础上,增强了推理、对齐和工具使用能力。该模型采用Apache 2.0许可证,鼓励广泛采用和定制。
Open Source
Artificial Intelligence