7月初,华为刚刚宣布将其盘古大模型核心能力全面开源,原本是一场高调的技术发布,没想到短短几天内,就被一篇技术报告推上了风口浪尖。

一位来自哥斯达黎加大学、署名为韩国籍的学生在GitHub上发布报告称,华为新近开源的盘古Pro MoE 720B模型,和阿里巴巴此前开源的通义千问Qwen-2.5模型,在参数结构上高度相似,甚至注意力参数的相似度高达0.927——这个数字几乎可以称得上是“克隆级别”的一致。

更令人关注的是,有人在盘古模型的开源文件中发现了“Copyright 2024 The Qwen team, Alibaba Group”的字样。这无疑让“参考”与“抄袭”的边界变得模糊起来。

随着消息在社区中迅速发酵,质疑声如潮水般袭来。甚至有网友戏称,华为盘古大模型或许只是“套壳再包装”的版本。这样的调侃背后,实则是人们对技术原创性的关注,也是对大厂行为透明度的追问。

面对争议,华为很快作出回应。

7月5日,诺亚方舟实验室发布声明称,盘古Pro MoE模型完全基于昇腾硬件平台自研开发,并非在其他厂商模型的基础上做增量训练。

同时也承认部分基础组件确实参考了业界开源实践,并强调这些代码都严格遵循了开源协议,标注清晰,合规使用。

这份回应看似全面,但却没有正面回答“是否使用了通义千问模型代码”这一关键问题,也因此并未平息舆论质疑。

更具戏剧性的一幕在7月6日凌晨出现。一位自称盘古大模型团队内部员工的网友发布爆料称,团队在开发初期由于算力紧张、进度压力大,确实存在“套壳竞品”“续训模型”“清洗水印”等做法,并称这些行为在一定程度上是“被默许”的。

爆料文章内容如下:

图片源自网络,如有侵权立即删除

目前华为尚未对这一自曝内容作出正式回应,而事件的另一当事方——阿里巴巴通义千问团队,也保持沉默。

种种迹象让这场“技术门”事件变得更加复杂。有人认为这只是模型研发中常见的“相似结构现象”,因为大模型训练在底层架构上很容易趋同;也有人坚持认为,发现了源码标注、参数一致等“实锤”,不能轻描淡写地归为巧合。

值得注意的是,这起事件中涉及的核心问题,并不仅仅是技术层面的“谁抄了谁”,更重要的是,在一个高强度竞争、信息高度开放的大模型时代,如何在开源生态中实现真正的合规、尊重版权,又不妨碍创新的快速推进。

我们不能否认,华为盘古模型的开源确实是昇腾生态战略的一次大动作。

官方发布的信息显示,盘古Pro MoE拥有720亿参数,是迄今为止华为最强大的一代模型。

而类似Meta、DeepSeek等团队的开源举措,也都在引发全球关注。正因为如此,人们才更加期待每一个开源动作背后的技术细节是否经得起推敲。

从事件发展来看,这更像是一场“技术信任危机”与“品牌道德感”的博弈。

在这场博弈中,开源精神、业界规范以及公众舆论,共同成为推动事情走向透明与真实的力量。

截至目前,最初引发风波的那篇GitHub技术报告已被删除,发布者称将会向ICLR等会议投稿。而围绕盘古大模型是否真正“套壳”通义千问,或是否存在“合规瑕疵”的争议,仍未尘埃落定。

技术之外,这场风波也给我们带来了更值得思考的问题:在AI时代,创新与透明,到底能否兼得?

扫码加入技术琐话读者群,如果群满,联系wx:jianghu10002

图片

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐