Qwen3-Next-80B重磅登场：FP8量化技术引领开源大模型性能革命

[![该柱状图对比了Qwen3-Next-80B-A3B-Thinking大模型与Gemini-2.5-Flash Thinking等模型在SuperGPQA、AIME25等权威基准测试中的性能表现，直观展示其在复杂推理任务上的突破性进展。](https://gitcode-ai-aigc.obs.cn-north-4.myhuaweicloud.com:443/images/1b1290b85d

侯彬颖Butterfly

567人浏览 · 2025-11-29 02:23:40

侯彬颖Butterfly · 2025-11-29 02:23:40 发布

2025年11月12日，人工智能领域迎来重大突破——Qwen3-Next系列首款旗舰模型Qwen3-Next-80B-A3B-Thinking-FP8正式开源发布。这款搭载800亿参数的新一代大模型，通过深度整合FP8量化技术，在保持计算精度的前提下实现了推理性能的跨越式提升，同时大幅降低了部署门槛。该模型在技术架构上实现了多项业界首创，包括混合注意力机制的创新融合、高稀疏性混合专家（MoE）系统的构建、训练稳定性框架的全面优化，以及多token预测（MTP）能力的深度集成。其中，混合注意力机制通过Gated DeltaNet与Gated Attention的双向协同，成功突破了超长文本序列建模的效率瓶颈；而高稀疏性MoE层设计则通过将专家激活率控制在行业领先的极低水平，在维持千万亿参数级模型容量的同时，使单token计算量（FLOPs）实现数量级下降，为大模型的高效部署开辟了新路径。

【免费下载链接】Qwen3-Next-80B-A3B-Thinking-FP8 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-Next-80B-A3B-Thinking-FP8

获取方式：Qwen3-Next-80B-A3B-Thinking-FP8
项目地址: https://gitcode.com/hf_mirrors/Qwen/Qwen3-Next-80B-A3B-Thinking-FP8

如上图所示，该对比图表清晰呈现了Qwen3-Next-80B-A3B-Thinking模型在SuperGPQA、AIME25等多项权威基准测试中的性能表现。这一实测数据充分验证了新模型在复杂推理任务上的技术突破，为AI开发者选择高性能大模型提供了客观的技术参考依据。

在上下文处理能力方面，Qwen3-Next-80B-A3B-Thinking展现出惊人的文本驾驭能力，原生支持262,144 token的超长文本输入，通过集成业界领先的YaRN上下文扩展算法，可无缝将处理能力提升至百万token级别，完美满足法律文档分析、代码库理解、学术文献综述等超大规模文本场景的需求。第三方性能测试数据显示，该模型在MMLU（大规模多任务语言理解）、GSM8K（数学推理）等权威推理基准上全面超越Qwen3-30B-A3B-Thinking-2507与Qwen3-32B-Thinking等前代产品，并在医学、法律等多项专业领域测试中实现对Gemini-2.5-Flash-Thinking等闭源模型的性能超越，标志着开源大模型在高端AI能力领域的又一重要里程碑。

如上图所示，该架构图详细解析了Qwen3-Next模型的核心技术布局，直观展示了混合注意力模块与MoE层的协同工作机制。这一可视化呈现帮助技术人员快速理解模型的创新设计原理，为二次开发和优化部署提供了重要参考框架。

部署生态方面，Qwen3-Next-80B-A3B-Thinking已完成与sglang、vllm等主流高性能推理框架的深度适配，开发者可通过标准API接口快速构建智能服务。其内置的工具调用能力与超长文本流式处理引擎，使开发者能够轻松实现从数据分析到多模态交互的复杂应用开发。值得关注的是，该模型在保持高性能的同时，通过FP8量化技术显著降低了硬件部署门槛，普通企业级GPU即可实现高效推理，大幅降低了AI技术落地的成本壁垒。

随着该模型的开源发布，AI社区将获得兼具极致性能与部署灵活性的新一代基础模型，有望在企业级智能客服、自动驾驶决策系统、科学计算辅助、金融风险分析等领域催生更多创新应用。未来，Qwen3-Next系列或将继续拓展模型规模与技术边界，计划推出支持多模态交互的增强版本，并进一步优化边缘设备部署方案，推动开源大模型向更高效、更智能、更易用的方向加速演进。作为开源AI生态的重要贡献，Qwen3-Next-80B-A3B-Thinking-FP8的发布不仅为开发者提供了强大的技术工具，更将加速人工智能技术在各行业的深度应用，为数字经济发展注入新动能。

获取方式：Qwen3-Next-80B-A3B-Thinking-FP8
项目地址: https://gitcode.com/hf_mirrors/Qwen/Qwen3-Next-80B-A3B-Thinking-FP8

【免费下载链接】Qwen3-Next-80B-A3B-Thinking-FP8 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-Next-80B-A3B-Thinking-FP8