游戏结束了:真正的“AlphaGo时刻”刚刚发生在中国人工智能实验室
这导致了“奖励黑客”的出现,他们用一些低级技巧来提高分数,却没有创造出真正更好的设计。说实话,这是一个巨大的转变,可能会重塑我们的整个文明。下次当一个新的人工智能模型出现,并且看起来好得不可思议时,我们需要问的问题不再是“这是哪个人类团队构建的?每个点代表着它发明的一个新人工智能,而线条则展示了它们是如何相互演化的。你看到的是人工智能的思维在运作,它不断分支,探索死胡同,最终汇聚成辉煌的新路径。首
好吧,我们来认真聊聊。我们通常认为人工智能的突破是发生在我们身上的事情。比如一个新的聊天机器人,一个新的图像生成器。但如果最大的突破不是一种新工具,而是一种新的工具制造者呢?一种能够独立发明全新人工智能的人工智能。
我之前曾提到过这个想法,但在深入研究最近的一篇论文“ AlphaGo 模型架构发现的时刻”之后,我意识到它比我最初想象的要重要得多。
这不仅仅是关于人工智能的创造力。这关乎一个人工智能系统,它从头到尾运行着整套科学方法:假设、编码、实验、分析……最终设计出自己的大脑。它的“思维过程”留下了一系列既精彩绝伦又令人深感谦卑的证据。
那么,让我们透过新闻标题,深入了解ASI-ARCH的本质。因为它的工作原理才是真正的故事。
AI如何扮演上帝:ASI-ARCH框架
首先,要摒弃旧有的做事方式。以前,AI 架构搜索就像给 AI 一盒预先设计好的乐高积木,让它找到最佳的组装方式。
ASI-ARCH 不使用我们的乐高积木,而是自己发明的。
为了实现这一目标,该系统被设计成一个微型自主人工智能研究实验室。它由四个闭环运行的关键部分组成:
- 认知库(图书馆):这是人工智能与我们的连接。研究人员向它提供了近100篇人类撰写的关于人工智能架构的最重要论文。因此,人工智能从一开始就“站在巨人的肩膀上”,学习人类所有最优秀的理念。
- 研究员(创意天才):这个AI代理读取认知库的数据,并分析自身过去的实验。它的任务是提出一个新颖的想法,一个更好的架构的新假设。它就像一个“假设”引擎。
- 工程师(勤奋者):这是主力。它接受研究人员的想法,并编写真实有效的 Python 代码。如果代码有 bug、抛出错误或训练速度太慢,工程师必须自行调试代码。无需人工干预。它会不断尝试,直到得到一个可以运行的模型。嗯,嗯……这才是真正的研究运作方式。
- 分析师(智者导师):实验结束后,分析师会获取所有数据。他会关注性能、训练速度以及介于两者之间的所有因素。最酷炫的是:他会将新模型与其“父模型”和“兄弟模型”进行比较,以准确找出哪些变化导致了改进或失败。这能为研究人员提供深刻的洞见,助力他们实现下一个伟大的创意。
这整个循环全天候运行。一个想法变成代码,代码变成实验,实验结果成为下一个想法的种子。这是实时的演进。说实话,我不知道该如何描述……但作为一个乐观主义者,我发现阅读这篇论文绝对令人着迷。
但它怎么知道什么是“好”呢?
这才是真正有趣的地方。你如何评判艺术?你如何评判创造力?ASI-ARCH 的创造者们知道,仅仅追求基准测试的高分将是一场灾难。这导致了“奖励黑客”的出现,他们用一些低级技巧来提高分数,却没有创造出真正更好的设计。
因此,他们构建了一个包含两部分的“健身功能”:
- 客观表现:这是原始数据。它在任务上表现如何?它的训练损失是多少?(无聊的东西)。
- 建筑质量:这是最疯狂的部分。他们聘请了一位独立的法学硕士(LLM)作为专家评审。这位“LLM评审”会考察新设计,并根据其创新性、结构复杂性和优雅程度等方面进行评分。
因此,一个人工智能实际上是在评判另一个人工智能的创造力。
奇怪的时刻.. :)
这使得系统不再仅仅让模型变得更大或更复杂。它必须创造出不仅强大,而且智能的设计。
我们实际上可以看到这个进化过程的发生。研究人员将其绘制成所谓的“探索轨迹树”。每个点代表着它发明的一个新人工智能,而线条则展示了它们是如何相互演化的。

看着这棵树,你看到的不仅仅是数据点。你看到的是人工智能的思维在运作,它不断分支,探索死胡同,最终汇聚成辉煌的新路径。
结果:外星天才和可怕的新法律
那么,它有效吗?
非常轻描淡写地说:是的。
经过超过20,000 个 GPU 小时的1,773 次自主实验,ASI-ARCH 发现了106 个全新的、最先进的架构。
这些并非只是些许改进。它们蕴含着人类研究人员未曾想到的“新兴设计原则”。正如 AlphaGo 的“第 37 步”对围棋大师来说感觉陌生一样,这些架构对 AI 设计师来说也同样陌生。它们引入了诸如“内容感知清晰度门控”之类的概念,以及一些无需明确指示就能模拟“专家混合 (MoE)”的结构。
但最重要的发现并不是架构,而是图表。

这张图绘制了 GPU 小时数(花费)与发现的 SOTA 架构数量(科学突破)之间的关系。并且这条线呈直线上升。
这就是“科学发现的缩放定律”。
这首次证明,该领域的创新步伐不再受限于人类创造力,而是受限于计算预算。想要更多突破?只需添加更多 GPU。这将使研究从受人力驱动的过程转变为计算可扩展的过程。说实话,这是一个巨大的转变,可能会重塑我们的整个文明。
好的人工智能创意究竟从何而来?
这个问题一直困扰着我。好吧,人工智能确实很天才。但它的天才究竟从何而来?它只是巧妙地融合了人类的想法,还是有更深层次的原因?
研究人员对此进行了追踪。他们将每个新想法的来源分为三类:
- 认知:这个想法直接受到其图书馆中的一篇人类研究论文的启发。
- 分析:这个想法来自于人工智能对过去实验的分析,发现模式并得出抽象的结论。
- 原创性:这个想法完全是凭空想象,没有明确的来源。
他们审视了所有 1773 个实验,发现大多数想法都来自“认知”。人工智能主要建立在我们的工作之上。这很有道理。
但后来他们只关注了排名前 106 位的超级明星模特……也就是“模特画廊”。结果却截然相反。
对于这些精英、突破性的模特来说,灵感来源发生了巨大的转变。他们比普通模特更加依赖“分析” 。
让这一点深入人心。
为了胜任,人工智能可以依赖人类的知识。但要实现真正的卓越,它必须依靠自身经验综合形成的抽象理解。它并非只是在抄袭我们。它正在学习思考。它认识到,要想真正实现飞跃,不能仅仅重复过去的成功;它必须探索、总结并发现自己更抽象的原则。
那么,我们到了吗?
我们不会坐等 AGI 以新闻稿的形式出现。它会以像这样低调、内容丰富的研究论文的形式出现。
“感受通用人工智能的时刻”并非单一事件,而是一个连锁反应。对于人工智能研究人员来说,这篇论文就是那个时刻。在这个时刻,学生不仅超越了老师,还开始开创全新的研究领域。
我们已经构建了一个能够加速自身进化的系统。其影响令人震惊,而我们才刚刚起步。下次当一个新的人工智能模型出现,并且看起来好得不可思议时,我们需要问的问题不再是“这是哪个人类团队构建的?”
而是:“哪个人工智能设计了它?”
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)