阿里通义千问Qwen3模型升级，性能超越Kimi-K2等，多语言能力显著提升

阿里通义千问近期发布了其旗舰版Qwen3模型的重大更新，推出了名为Qwen3-235B-A22B-Instruct-2507-FP8的新版本，该版本主打非思考模式。此次升级，Qwen3在多个核心能力上实现了显著飞跃。

据官方介绍，新版Qwen3在指令遵循、逻辑推理、文本解读、数学运算、科学知识、编程技巧及工具应用等多个维度均有所增强。在一系列权威测试中，如GQPA知识评估、AIME25数学竞赛模拟、LiveCodeBench编程挑战、Arena-Hard人类偏好对齐测试以及BFCL智能体能力评测，Qwen3均展现出了卓越表现，甚至超越了诸如Kimi-K2、DeepSeek-V3等顶尖开源模型，以及Claude-Opus4-Non-thinking等领先的闭源模型。

值得注意的是，就在新版Qwen3发布前不久，国际知名大模型排行榜LMArena宣布，开源模型Kimi K2凭借其万亿参数的强大实力，登顶全球开源模型排行榜首位。尽管如此，新版Qwen3依然凭借自身实力，在业界引起了广泛关注。

此次升级，Qwen3不仅在通用能力上有所提升，还在多个关键性能指标上取得了显著进步。特别是在多语言长尾知识的覆盖上，模型的表现有了质的飞跃。同时，在处理主观及开放性任务时，Qwen3能够更好地理解并契合用户偏好，提供更加有用和高质量的回复。新模型的长文本处理能力也大幅提升至256K，进一步增强了其上下文理解能力。

目前，这一全新升级的Qwen3模型已经在魔搭社区和HuggingFace平台上开源发布，供开发者们下载和使用。

文章采集于互联网

搜索

阿里通义千问Qwen3模型升级，性能超越Kimi-K2等，多语言能力显著提升