Arch-Router-1.5B模型论文速读：使大型语言模型的路由与人类偏好保持一致

《Arch-Router: 基于人类偏好的LLM路由框架》提出了一个创新性的大语言模型路由系统。该研究针对现有路由方法的两大局限：评估标准与用户主观偏好的脱节，以及模型池扩展的困难，设计了一个偏好对齐的双层路由框架。通过Domain-Action分类法结构化和解耦路由策略与模型选择，支持用户用自然语言定义路由偏好。研究者开发了两阶段数据生成流程，构建了包含43,000样本的训练集，并训练出1.5B

Panesle

1879人浏览 · 2025-07-06 22:30:00

Panesle · 2025-07-06 22:30:00 发布

《Arch-Router: Aligning LLM Routing with Human Preferences》论文

一、研究背景与动机

随着大语言模型（LLM）的快速 proliferation，不同模型在 strengths、style 或 latency/cost profile 方面各有优化，路由技术成为 operationalize 多模型使用的关键。然而，现有 LLM 路由方法存在两大局限：一是使用 benchmarks 评估性能，难以捕捉用户基于主观标准的偏好；二是可选择的模型池有限，且通常需要 retraining 或架构修改才能支持新模型或用例。

为解决这些局限，论文提出一个与偏好对齐的路由框架，通过匹配查询与用户定义的领域（如旅行）或操作类型（如图像编辑），为路由决策提供实用机制。该框架以 Domain-Action Taxonomy 为基础，允许用户用自然语言定义路由策略。

二、研究方法

（一）框架设计

论文提出一个包含以下关键组件的偏好对齐路由框架：

Domain-Action Taxonomy：采用两层结构建模 LLM 路由，其中 Domain 捕获查询的高层次主题背景，Action 表示请求的具体操作。这种分类有助于用户定义清晰、结构化的路由策略，同时避免了平展标签列表的笨重感。
路由机制：分为两个阶段。第一阶段，偏好对齐路由器 F 根据用户查询 q 和完整路由策略集 C 选择最合适策略 c；第二阶段，映射 T 将选定策略关联到特定 LLM 模型。这种解耦设计使模型选择完全委托给 T，允许动态添加、移除或替换模型，无需重新训练或修改路由器。

（二）数据生成框架

为支持 Arch-Router，作者设计了两阶段数据生成流程：

第一阶段：数据生成：通过结构化两步过程创建干净、结构正确的对话。首先，基于行业分类、学术基准和真实 API 文档构建多样化主题池，使用 LLM 生成候选路由策略，再由第二个 LLM 验证和精炼这些策略。其次，利用精炼后的路由策略生成对话意图，并由另一个 LLM 生成完整对话。最终由 LLM 验证对话与路由策略的一致性。
第二阶段：数据增强：通过三种技术增强数据集，引入现实世界复杂性：一是无关信息注入，添加离题用户消息或移除真实路由策略；二是策略修改，引入不相关或误导性选项；三是场景混合，组合不同对话片段创建包含主题切换、后续问题等复杂对话。

（三）Arch-Router 模型

Arch-Router 是一个紧凑的 1.5B 生成式语言模型。它通过处理包含用户查询 q 和所有可能路由策略 C 的输入提示 x，生成路由标识符。其训练目标是最大化生成输出为正确路由策略的可能性，通过最小化交叉熵损失实现。

三、实验设计与结果

（一）实验设置

评估语料：使用 CLINC-150、MANtIS、SGD 和 LMSYS-1M 四个公开数据集。对这些数据集进行增强，使用 LLM 生成路由描述并通过验证步骤确保一致性。
比较池：与 OpenAI、Anthropic、Gemini 和原始 Qwen2.5-1.5B 等多个 proprietary 模型家族进行比较。
训练细节：采用监督微调（SFT），使用 Llama-Factory 库，进行全参数更新，使用 AdamW 优化器，最大训练四个 epoch，训练样本 43,000 对，训练/验证集按 90/10 分割。
评估指标：从三个层次评估模型性能：单轮（Turn）、连续相同路由标签的跨度（Span）和完整对话（Conversation）。

（二）结果分析

Arch-Router 在整体路由得分中达到 93.17%，超过其他候选模型平均 7.71%。其在跨度级和完整对话级准确性分别达到 94.98% 和 88.48%，表明其在处理多轮对话方面优于其他模型。在细粒度查询到细粒度答案（fQfA）基准测试中，Arch-Router 达到 98.11，证明其能够将查询映射到特定操作路由策略。此外，其在处理无关请求或请求完成（Irrelevance）任务中的表现与 Claude-sonnet-3.7 匹配，显示其在查询提示较粗或超出分布时的稳健性。

四、分析与讨论

（一）模型行为分析

通过分析 SGD 数据集上的错误模式，发现 Arch-Router 和 Claude-Sonnet-3.7 的失败特征不同。Arch-Router 主要失败于初始轮次，若正确识别用户意图，则后续轮次高度稳健。而 Claude-Sonnet-3.7 的失败更分散，主要发生在中后期轮次，表明其在处理后续请求时对上下文跟踪较弱。

（二）偏好对齐与性能对齐路由比较

偏好对齐路由将质量判断权交给用户，通过多类分类匹配用户定义的路由策略；性能对齐路由则将质量判断委托给模型，使用分数函数预测最佳结果。偏好对齐路由适用于质量主观且由用户定义的场景，而性能对齐路由适合成本敏感且有可靠模型预测质量分数的环境。

（三）局限性

偏好对齐路由在透明度和控制方面具有明显优势，但也存在局限性：一是路由准确性受策略集精度限制，策略描述模糊或重叠会降低性能；二是路由有效性受用户模型选择限制，若用户将不合适模型分配给路由策略，即使路由准确也可能导致次优结果。

五、结论与展望

论文提出一个偏好对齐路由框架，允许用户将人类偏好编码为显式路由策略，并将策略与模型选择解耦，从而实现更透明、灵活的路由决策。在此框架下，作者展示了 Arch-Router 和两阶段数据创建流程。实验结果表明，Arch-Router 在多轮对话基准测试中超越最佳 proprietary 模型。未来工作包括探索结合偏好对齐路由与精确性能目标的混合框架，以及支持更广泛路由策略的人类偏好建模。

论文核心技术汇总

在这里插入图片描述

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。