华为盘古大模型陷“抄袭门”？背后真相远比你想的复杂

一位来自哥斯达黎加大学、署名为韩国籍的学生在GitHub上发布报告称，华为新近开源的盘古Pro MoE 720B模型，和阿里巴巴此前开源的通义千问Qwen-2.5模型，在参数结构上高度相似，甚至注意力参数的相似度高达0.927——这个数字几乎可以称得上是“克隆级别”的一致。更具戏剧性的一幕在7月6日凌晨出现。值得注意的是，这起事件中涉及的核心问题，并不仅仅是技术层面的“谁抄了谁”，更重要的是，在一

大家叫我导演

1406人浏览 · 2025-07-08 08:34:06

大家叫我导演 · 2025-07-08 08:34:06 发布

7月初，华为刚刚宣布将其盘古大模型核心能力全面开源，原本是一场高调的技术发布，没想到短短几天内，就被一篇技术报告推上了风口浪尖。

一位来自哥斯达黎加大学、署名为韩国籍的学生在GitHub上发布报告称，华为新近开源的盘古Pro MoE 720B模型，和阿里巴巴此前开源的通义千问Qwen-2.5模型，在参数结构上高度相似，甚至注意力参数的相似度高达0.927——这个数字几乎可以称得上是“克隆级别”的一致。

随着消息在社区中迅速发酵，质疑声如潮水般袭来。甚至有网友戏称，华为盘古大模型或许只是“套壳再包装”的版本。这样的调侃背后，实则是人们对技术原创性的关注，也是对大厂行为透明度的追问。

面对争议，华为很快作出回应。

7月5日，诺亚方舟实验室发布声明称，盘古Pro MoE模型完全基于昇腾硬件平台自研开发，并非在其他厂商模型的基础上做增量训练。

同时也承认部分基础组件确实参考了业界开源实践，并强调这些代码都严格遵循了开源协议，标注清晰，合规使用。

这份回应看似全面，但却没有正面回答“是否使用了通义千问模型代码”这一关键问题，也因此并未平息舆论质疑。

更具戏剧性的一幕在7月6日凌晨出现。一位自称盘古大模型团队内部员工的网友发布爆料称，团队在开发初期由于算力紧张、进度压力大，确实存在“套壳竞品”“续训模型”“清洗水印”等做法，并称这些行为在一定程度上是“被默许”的。

爆料文章内容如下：

图片源自网络，如有侵权立即删除

目前华为尚未对这一自曝内容作出正式回应，而事件的另一当事方——阿里巴巴通义千问团队，也保持沉默。

种种迹象让这场“技术门”事件变得更加复杂。有人认为这只是模型研发中常见的“相似结构现象”，因为大模型训练在底层架构上很容易趋同；也有人坚持认为，发现了源码标注、参数一致等“实锤”，不能轻描淡写地归为巧合。

值得注意的是，这起事件中涉及的核心问题，并不仅仅是技术层面的“谁抄了谁”，更重要的是，在一个高强度竞争、信息高度开放的大模型时代，如何在开源生态中实现真正的合规、尊重版权，又不妨碍创新的快速推进。

我们不能否认，华为盘古模型的开源确实是昇腾生态战略的一次大动作。

官方发布的信息显示，盘古Pro MoE拥有720亿参数，是迄今为止华为最强大的一代模型。

而类似Meta、DeepSeek等团队的开源举措，也都在引发全球关注。正因为如此，人们才更加期待每一个开源动作背后的技术细节是否经得起推敲。

从事件发展来看，这更像是一场“技术信任危机”与“品牌道德感”的博弈。

在这场博弈中，开源精神、业界规范以及公众舆论，共同成为推动事情走向透明与真实的力量。

截至目前，最初引发风波的那篇GitHub技术报告已被删除，发布者称将会向ICLR等会议投稿。而围绕盘古大模型是否真正“套壳”通义千问，或是否存在“合规瑕疵”的争议，仍未尘埃落定。

技术之外，这场风波也给我们带来了更值得思考的问题：在AI时代，创新与透明，到底能否兼得？

扫码加入技术琐话读者群，如果群满，联系wx：jianghu10002

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模