阿里通义千问近期发布了其旗舰版Qwen3模型的重大更新,推出了名为Qwen3-235B-A22B-Instruct-2507-FP8的新版本,该版本主打非思考模式。此次升级,Qwen3在多个核心能力上实现了显著飞跃。
据官方介绍,新版Qwen3在指令遵循、逻辑推理、文本解读、数学运算、科学知识、编程技巧及工具应用等多个维度均有所增强。在一系列权威测试中,如GQPA知识评估、AIME25数学竞赛模拟、LiveCodeBench编程挑战、Arena-Hard人类偏好对齐测试以及BFCL智能体能力评测,Qwen3均展现出了卓越表现,甚至超越了诸如Kimi-K2、DeepSeek-V3等顶尖开源模型,以及Claude-Opus4-Non-thinking等领先的闭源模型。
值得注意的是,就在新版Qwen3发布前不久,国际知名大模型排行榜LMArena宣布,开源模型Kimi K2凭借其万亿参数的强大实力,登顶全球开源模型排行榜首位。尽管如此,新版Qwen3依然凭借自身实力,在业界引起了广泛关注。
此次升级,Qwen3不仅在通用能力上有所提升,还在多个关键性能指标上取得了显著进步。特别是在多语言长尾知识的覆盖上,模型的表现有了质的飞跃。同时,在处理主观及开放性任务时,Qwen3能够更好地理解并契合用户偏好,提供更加有用和高质量的回复。新模型的长文本处理能力也大幅提升至256K,进一步增强了其上下文理解能力。
目前,这一全新升级的Qwen3模型已经在魔搭社区和HuggingFace平台上开源发布,供开发者们下载和使用。
文章采集于互联网