Qwen3-235B-A22B-Thinking-2507

Qwen迄今为止最先进的推理模型

2025-07-26

Qwen3-235B-A22B-Thinking-2507
Qwen3-235B-A22B-Thinking-2507是一款强大的开源混合专家模型(活跃参数22B),专为深度推理设计。它在代理任务上取得了最先进的成果,支持256K的上下文长度,并且可以通过Hugging Face平台或API获取。
Qwen3-235B-A22B-Thinking-2507是一款专为复杂推理任务设计的高级开源专家混合(MoE)模型。拥有2350亿总参数(220亿活跃),在逻辑推理、数学、编码以及代理任务上提供最先进的性能表现。该模型支持扩展的256K上下文窗口,使得更深入的分析和更连贯的长篇输出成为可能。主要改进包括增强的指令遵循、工具使用以及与人类偏好一致的文本生成。基准测试显示,在学术和多语言任务上,与领先模型相比,该模型展现出卓越的结果。通过Hugging Face和API可用,针对vLLM和SGLang等框架的部署进行了优化。非常适合需要高水平推理的研究和应用,Qwen3在集成工具调用支持的代理工作流程中表现出色。注意:此版本仅工作在“思考模式”下,优先考虑详细推理而非标准聊天响应。
API Open Source Artificial Intelligence