人工智能的悄然进化：超越传统人工智能模型的复合人工智能系统的崛起 [译]

老树头

1278人浏览 · 2024-03-16 13:17:06

老树头 · 2024-03-16 13:17:06 发布

作者：德辛·齐亚博士

Tehseen Zia 博士是伊斯兰堡 COMSATS 大学的终身副教授，拥有奥地利维也纳科技大学的人工智能博士学位。他专注于人工智能、机器学习、数据科学和计算机视觉，在著名科学期刊上发表论文，做出了重大贡献。Tehseen 博士还作为首席研究员领导了多个工业项目，并担任人工智能顾问。

当我们了解最近的人工智能 (AI) 发展时，一个微妙但重大的转变正在发生，从依赖大型语言模型 (LLM)等独立 AI 模型转向更加细致和协作的复合 AI 系统（例如AlphaGeometry和检索增强生成）（RAG）系统。这种演变在 2023 年势头强劲，反映出人工智能如何处理不同场景的范式转变，不仅通过扩展模型，而且通过多组件系统的战略组装。这种方法利用不同人工智能技术的综合优势，更高效地解决复杂问题。在本文中，我们将探讨复合人工智能系统、它们的优势以及设计此类系统的挑战。

什么是复合人工智能系统（CAS）？

复合人工智能系统（CAS）是一个集成了不同组件的系统，包括但不限于人工智能模型、检索器、数据库和外部工具，以有效地处理人工智能任务。与仅使用一种人工智能模型（例如基于 Transformer 的 LLM）的旧式人工智能系统不同，CAS 强调多种工具的集成。CAS 的示例包括 AlphaGeometry，其中法学硕士与传统的符号求解器相结合来解决奥林匹克问题，以及 RAG 系统，其中法学硕士与检索器和数据库相结合，用于回答与给定文档相关的问题。在这里，了解多模态 AI和 CAS 之间的区别非常重要。多模态 AI 专注于处理和集成来自各种模态（文本、图像、音频）的数据，以做出明智的预测或响应（如Gemini模型），而 CAS 集成了多个交互组件（如语言模型和搜索引擎），以提高 AI 任务的性能和适应性。

CAS的优势

与传统的基于单一模型的 AI 相比，CAS 具有许多优势。其中一些优点如下：

- 增强的性能： CAS 结合了多个组件，每个组件专门负责特定的任务。通过利用各个组件的优势，这些系统实现了更好的整体性能。例如，将语言模型与符号求解器相结合可以在编程和逻辑推理任务中获得更准确的结果。
- 灵活性和适应性：复合系统可以适应不同的输入和任务。开发人员可以更换或增强单个组件，而无需重新设计整个系统。这种灵活性允许快速调整和改进。
- 稳健性和弹性：不同的组件提供冗余和稳健性。如果一个组件出现故障，其他组件可以进行补偿，从而确保系统稳定性。例如，使用检索增强生成（RAG）的聊天机器人可以优雅地处理丢失的信息。
- 可解释和可解释：使用多个组件使我们能够解释每个组件如何对最终输出做出贡献，从而使这些系统可解释和透明。这种透明度对于调试和信任至关重要。
- 专业化和效率： CAS 使用多个专门从事特定 AI 任务的组件。例如，专为医疗诊断而设计的 CAS 可能会包含一个擅长分析医学图像（例如 MRI 或 CT 扫描）的组件，以及另一个专门从事自然语言处理以解释患者病史和笔记的组件。这种专业化允许系统的每个部分在其域内高效运行，从而提高诊断的整体有效性和准确性。
- 创意协同：结合不同的组件可以释放创造力，从而产生创新能力。例如，融合文本生成、视觉创作和音乐创作的系统可以产生有凝聚力的多媒体叙述。这种集成使系统能够制作复杂的多感官内容，而使用孤立的组件很难实现这些内容，从而展示了不同人工智能技术之间的协同作用如何促进新形式的创意表达。

构建 CAS：策略和方法

为了利用 CAS 的优势，开发人员和研究人员正在探索各种构建方法。下面提到的是两个关键方法：

神经符号方法：该策略将神经网络在模式识别和学习方面的优势与符号人工智能的逻辑推理和结构化知识处理能力结合起来。目标是将神经网络的直观数据处理能力与符号人工智能的结构化逻辑推理相结合。这种组合旨在增强人工智能的学习、推理和适应能力。这种方法的一个例子是Google 的 AlphaGeometry，它使用神经大型语言模型来预测几何图案，而符号 AI 组件则处理逻辑和证明生成。这种方法旨在创建既高效又能够提供可解释解决方案的人工智能系统。
语言模型编程：这种方法涉及使用旨在将大型语言模型与其他人工智能模型、API 和数据源集成的框架。此类框架允许对人工智能模型的调用与各种组件的无缝组合，从而能够开发复杂的应用程序。利用LangChain和LlamaIndex等库以及AutoGPT和BabyAGI等代理框架，该策略支持高级应用程序的创建，包括 RAG 系统和WikiChat等会话代理。这种方法侧重于利用语言模型的广泛功能来丰富和多样化人工智能应用程序。

CAS 开发的挑战

开发 CAS 带来了开发人员和研究人员必须应对的一系列重大挑战。该过程涉及集成不同的组件，例如 RAG 系统的构建涉及组合检索器、向量数据库和语言模型。每个组件都有多种选项，这使得复合人工智能系统的设计成为一项具有挑战性的任务，需要仔细分析潜在的组合。由于需要仔细管理时间和金钱等资源以确保开发过程尽可能高效，这种情况变得更加复杂。

一旦复合人工智能系统的设计确定，它通常会经历一个旨在提高整体性能的细化阶段。此阶段需要微调各个组件之间的相互作用，以最大限度地提高系统的效率。以 RAG 系统为例，此过程可能涉及调整检索器、向量数据库和 LLM 的协同工作方式，以改进信息检索和生成。与相对简单的优化单个模型不同，优化像 RAG 这样的系统会带来额外的挑战。当系统包含搜索引擎等在调整方面不太灵活的组件时尤其如此。这种限制给优化过程带来了额外的复杂性，使其比优化单组件系统更加复杂。

底线

向复合人工智能系统 (CAS) 的过渡标志着人工智能开发的改进方法，将重点从增强独立模型转移到构建集成多种人工智能技术的系统。这种演变以 AlphaGeometry 和检索增强生成 (RAG) 等创新为亮点，标志着人工智能在使人工智能更加通用、强大、能够通过细致入微的理解解决复杂问题方面取得了进步。通过利用不同人工智能组件的协同潜力，CAS 不仅突破了人工智能所能实现的界限，而且还引入了一个未来进步的框架，其中人工智能技术之间的协作为更智能、更具适应性的解决方案铺平了道路。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

魔乐社区

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

魔乐社区

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模