摘要:众多的金融机构及金融科技企业一直都在积极拥抱大模型的到来,除了已经涌现出若干金融垂域大模型以外,应用场景的探索也是重中之重,DeepSeek掀起大模型二次热潮,与Manus刮起的智能体旋风,又进一步增加了该领域的积极性与紧迫性。目前为止,相当多的金融大模型应用层出不穷,百花齐放,但仔细观察可以发现,大多还集中在改变或提升人机交互的方式方法层面,如智能客服、文档协助处理与生成、NL2SQL等全行业耳熟能详的领域。那么,大模型能否更加深入与广泛地与金融业务或科技需求融合以推进金融科技水平发生阶跃性的升级,甚至推动金融行业发生新一轮的智能化变革?本文首先明确是否并如何引入大模型的原则,提出金融行业可控大模型与有界智能体的价值观与方法论,接着试图尽量清晰地界定大模型的能力边界,然后对大模型在金融行业的具体应用领域进行全面的分析与讨论,旨在为大模型驱动的新一轮金融智能化行动提供参考与建议。

一、大模型驱动AI无处不在

DeepSeek将本就处于热点的大模型话题推向了新的高潮,模型能力不断加强;Manus又将智能体应用再一次推到了热点,相关的竞争与狂欢进入白热化与新的发展阶段。个人端与产业端投入大模型与智能体学习与探索的热情空前高涨,之前的很多观望者也纷纷入局。可以说,当下正在或者已经进入AI驱动数智化变革的关键时期。

然而各种实质性的进步大都发生在基础模型层面,大模型的商业价值发挥与应用场景探索,现阶段似乎还没有发生质的改变。

首先,至今,从通用基础大模型的技术趋势上讲,还是处于快速迭代的高速发展期,具体如下。

  1. 在以DeepSeek为标志的大模型新势力推动下,大模型推理、多模态、与人类对齐等能力边界不断拓展、快速提升;
  2. AI大模型从云侧向端侧渗透和延伸,小尺寸模型与端侧AI设备/AI算力芯片能力快速提升,云端协同计算架构逐渐成型;能独立运行的端侧AI应用成为可行;
  3. 使用大模型的成本持续降低,专业、小型、廉价的大模型形成发展趋势;
  4. 数据与AI大模型融合趋势明显,数据基础设施(库湖仓等)统一承载AI算力的一体化数据引擎发展迅速;
  5. 大模型监管不断趋严,大模型安全与相关检测技术地位不断提升;
  6. 技术上尝试将大模型数据与推理的分离也是一个值得关注并有意义的发展方向;
  7. 智能体、多Agents协同模式与MCP协议将快速扩大范围,进一步大幅度提升各种应用的自主化、自动化程度,以及各种资源的跨系统、跨内外动态融合能力;
  8. 关于大模型能力局限于“基于大量数据的统计重组与关联”的“人胜论”,与大模型将全面超越人类的“模胜论”的研究与争论一段时间内还会持续,但大模型应用快速发展的趋势不可阻挡。

除了基础模型方面各种开闭源大模型层出不穷,争奇斗妍以外,各行各业也掀起大模型智能应用探索的热潮,金融行业自然也不例外。本文认为,大模型有望彻底改变人工智能在金融科技中的应用状况,驱动AI无处不在。

长期以来,人工智能在金融行业的应用一直处于比较尴尬的状态:都在重视都在尝试却少有真正起到关键性作用的案例与场景,更不要说成为推动金融科技进步的主要因素了。“智能”这个词,相当多的情况下背后实际上是预定义规则,或者是部分自动化流程,以统计/机器学习为主体实现的并不多;而相当多采用统计/机器学习方法的项目,实效也并不理想。这主要是因为经典机器学习方法:

  1. 一是往往需要大量的、高质量的场景相关训练数据;
  2. 二是多数情况下需要参与人员同时具备极高的数据科技专业技能与极为深厚的场景相关业务知识经验,这通常是非常困难并难以规模化普及的;
  3. 三是所生产模型也只能适用于该专用场景,难以通用。       

实践证明,人员、成本及技术等多个因素决定了以机器学习为主的经典人工智能很难成为平民化的通用IT设施,是一个“奢侈品”,而绝大多数关于AI中台的规划设计都停留在概念上。因此,人工智能一直都没有成为金融科技建设发展的主力军,成点困难,有点无面,难以普及,名不符实......。

而大模型驱动的新生代人工智能则完全不同:

  1. 首先基础大模型本身是预训练的,它出生就已经带有相当丰富的通用知识,即使不做任何工作,直接在各行各业也都能产生一些效果;
  2. 其次,目前对基础大模型进行专向知识的训练补充,可以通过微调(fine-tuning)来实现,通常并不需要大批量的数据就可以产生非常不错的迁移效果;
  3. 另外,大模型还可以结合向量数据库,通过不需要训练的RAG(检索增加生成)方式高质效地实现对通用大模型进行专向知识补充;
  4. 更进一步,智能体Agent技术的编排规划能力又可以通过大模型得到极大的补充与增强,反过来有效约束了大模型的发散特征,大大扩展与提高了大模型解决问题的范围与质效。

因此,本文认为,虽然离AGI还有一段距离,但大模型有望使人工智能实现平民化,大大降低AI的使用难度,扩大应用范围,推动AI无处不在,成为通用IT基础设施。

但关于技术趋势分析,如上仅仅说了通用基础大模型与人工智能中台的趋势还不够,现阶段,在大模型应用落地层面,其实正处于一个尴尬期,或者说冷静期。

直到今天,不光是金融行业,相当多的行业头腰部、区域、领域,都已经基本建成或者正在建设大模型为代表的基础设施(可称为新基建),这是2022年大模型潮流奔涌而来后最明显的成果之一。但另外一个客观现象也值得注意,就是:虽然热度很高也都在积极探索,但真正有成效的应用大都还集中在、或者说本质还是处于“改变或提升人机交互的方式方法层面”,如智能客服、文档协助处理与生成、NL2SQL等全行业耳熟能详的领域(即使是这些,真正做出好的、优秀效果的也不算多),用大模型来提升行业核心业务能力产生实效的案例就更少了,特别在产业界更是如此,包括金融领域。这个现象也令很多人(包括一些最初对大模型极为热衷的人)也在内心提出疑问:大模型到底能在哪些方面产生实效作用?大模型究竟能不能发挥出明显推进行业数字化水平的作用

对科技服务厂商来讲,这是否正好是一个机遇期?还是不然?这是本文需要重点分析与回答的问题。

二、金融行业及环境特点

众所周知,金融行业一直以来都是信息科技与人工智能发展与应用的高地,金融科技也一直在行业数字化转型中处于引领地位,大模型自然也是如此。如果从纯技术角度,客观来讲,金融行业对大模型的需求与其它行业并没有什么特别之处,但金融行业有一些特点

. 首先是先导性。金融行业一直以来都是信息科技与人工智能发展与应用的高地,金融科技也一直在行业数字化转型中处于引领地位。大模型自然也是如此,也就是说,大模型在金融行业最应该率先发挥作用,也最有成熟条件发挥作用。无论是从基础设施,到中间支撑平台,再到具体应用,大模型在金融行业的落地,很容易成为其它行业效仿与学习的样板,也有助于将业务从核心金融拓展到周边相关的泛金融行业。换句话说,对金融科技服务商来讲,对大模型落地的探索应该重于其它行业,先于其它行业。

. 再者是专有性。金融行业由于受到相关法律、政策、监管的要求,约束了其通用基础大模型无法或者很难使用公开、公共的大模型服务,需要私有化部署,或者采用行业专属云服务方式。这个特点实际上也会影响金融科技服务商的技术与商业策略定位。也就是说,较其它行业而言,通用基础大模型、行业专属大模型等新基建,以及场景大模型、中间支撑平台以及具体应用在金融行业的都有充分的机会,需要根据实际情况进行决策。

. 另外是安全性。还是受到相关法律、政策、监管的要求,金融行业对大模型安全性的要求也明显高于其它行业,包括对大模型造成的隐私泄露、幻觉、不精确结果输出等的约束相对严格的多,这也导致金融科技服务商在各层级大模型相关服务中必须付出多于一些其它行业的投入,设计/开发相关方案,正面解答、应对、解决金融机构的相关要求。

. 还有是可复制性。金融行业的大模型应用,在同类机构(如同规模券商,城商行,农商行等)有较强的易复制性,且客户数量大,有较好的条件从点状突破发展到片状的商机。这种完全独立的行业机构之间的复制拓展,与垂直管理模式的各级政府机关之间的复制及其它行业相比,有一定特色。

三、金融大模型及应用现状

目前,在模型基础设施(Infra)与应用场景方面,众多的金融机构及金融科技企业都积极的探索与尝试。

首先是预训练的金融垂域大模型。在Transformer架构与LLM流行之前,实际上就已经有专业领域的金融大模型推出,如基于深度双向架构BERT、用于金融文本情感分析的FinBERT系列,以及基于生成器-鉴别器框架的ELECTRA模型的金融领域变体FLANG;2022年底由GPT3.5推动的Transformer架构流行以来,也出现了如T5(Text-to-Text Transfer Transformer),基于GPT的PloutosGPT,FinGPT,基于BLOOM的BloombergGPT,XuanYuan 2.0,基于LLama的FinMA、Fin-Llama、Cornucopia – Chinese,以及FinTral,以及华为盘古基础大模型之上的L1金融行业大模型与L2金融场景大模型等。同时,也有相当多的金融机构在采用全量或微调方法自行训练本企业或者行业专用的垂域大模型。

然后就是大模型的金融行业应用。本文认为,现阶段,真正有效的大模型金融应用场景探索比金融垂域大模型研发重要的多。与通用大模型不同的是,垂域大模型的作用主要体现在其所能支持的专业应用场景上,否则将毫无价值。在这一方面,可以说已经在业界掀起了一股强烈的探索热潮,其中部分是在自有垂域大模型基础之上开展,部分是直接在通用大模型之上开展,并已经取得了一些可圈可点的效果。目前为止,可见并已证明可以产生实效的场景主要包括:

  1. 智能客服:这几乎是所有行业最先执行并能最先产生明显效果的场景,金融当然也不例外。大家知道,在大模型出现之前的智能客服,大多还都是要基于相对固定的话术与即定规则执行,真正高体验与专业有效的客服工作还是要转人工才能完成。本次大模型热潮正是由ChatGPT在人机对话方面的震撼效果推动的,它无论在自然语言的理解上,还是对话生成上,多轮记忆能力上,可以说都达到了划时代的效果,在该方面将所有过去的真假人工智能都远远抛在了后面,可以使智能客服达到完全拟人化的效果;
  2. 文档分析:文档处理与生成也是大模型最擅长的能力。通过大模型可以实现高质量的金融文档摘要、命名实体识别(NER)、情感分析,可以协助生成各种金融专业文件与报告初稿。也有采用大模型进行文档(如评测报告、投标标书)质量审核与评估的尝试,其效果也在逐渐改进中;
  3. NL2SQL:这本质上也是语言类的场景,基本包括两个层次的工作:一是自然语言生成或者协助改进SQL,二是自然语言直接生成了报表或者分析的结果。第二个层次实际上是一个智能体的应用,用大模型编排规划多步的流程,然后综合调用各种工具接口实现,NL2SQL是其中比较关键的环节;
  4. 大模型辅助编程:用大模型来提高编程效率,也是金融机构和广大金融科技企业正在尝试中的生产效率提升类场景;
  5. 其它人机交互的改进:除了客服,人机交互的对话式场景还可以用在很多其它方面:如自然语言用户界面,技术服务与运维的智能代理,软件交互界面的自然语言化等,这些都属于对话类,本质上对客服是同一类场景。

需要指出的是,虽然上面这些场景都是大家能够最先想到的,但真正要做的很好,也不是那么容易,必须结合优质的技术架构与工具设计,模型优化,数据准备与处理,以及反复的尝试与试错,同时也不可避免的需要对所在行业与场景知识的专业性通过实操深入理解。以客服为例,可以说,即使对通用大模型什么也不做,直接使用或者简单定义一些提示词知识提示模板,也能达到一定的效果,比如百分之六、七十真人的准确度。但如果想到达到90%以上的准确率,那就必须结合专业细致的行业数据、话术抽象、切分,上下文学习/RAG使用,知识图谱的构造,对提问问题的意图分析、歧义拆解,人类反馈的常态化,模型的选择,模型微调中参数调优、数据质量与混合比例的调优、减少遗忘的策略设计,甚至模型结构的创新改造设计等手段综合起来,才可以达到。

虽然这些场景也需要投入相当专业的工作才可以达到比较好的实效,但可以发现,如上场景基本都可以归为一类,即人机交互方式的改变与提升,统称为自然语言用户界面也不为过。严格来讲,也还没有使大模型在金融科技或者金融业务的主体部分发生作用,例如金融科技中的数据、交易、运维体系系统性改进或改造,金融业务中的存、贷、投、保、风控、营销等产品或服务质效提升、模式变化甚至催生新业态。这正是大模型在金融行业的应用现状,即大都集中在人机交互模式的升级,还没有广泛深入到金融科技与业务的主体中,那么所谓智能金融革新的具像自然也处于较为模糊的阶段。

但由上文分析,我们还是希望并坚信大模型的能力远不仅限于此,坚信大模型能将人工智能在金融行业的应用推向新的水平,更加广泛与深入的改变金融科技与业务的现状,甚至驱动产生一个名符其实的智能金融新时代。下面我们将从大模型的应用引入原则,大模型的能力边界分析,以及具体的、更大范围的大模型金融应用场景几个方面进行论述(需要指出:本文主要讨论大语言模型LLM,以下统称大模型)。

四、大模型的应用引入原则

大模型究竟能在哪些应用中发挥作用?这是目前探讨最为热烈、广泛的问题。有观点认为大模型的适用范围非常广,几乎可以改造所有应用,人类即将进入人工智能无所不能、无处不在的时代,大量的工作工种将被人工智能替代,甚至有一股强烈声音认为人类自己都将被AI替代与控制;还有观点则认为大模型的作用被严重夸大与炒作了,实际上大模型的主要进步还是局限在自然语言的理解与对话生成上,在其它方面并没有明显的突出能力与优势。这两种观点究竟孰是孰非呢?

本文认为,大模型的应用探索,并不需要以准确回答这个问题为前提。或者说,评判“无敌论”与“炒作论”,对大模型究竟能在哪里发挥作用,没有太多的实际意义。我们需要回答的问题是:在应用中,究竟可以在哪些地方引入大模型?对这些问题的具像回答,我们会在后文中与大家一起探讨,但本文尽最大努力所能列举出来的场景参考,肯定只能涵盖大模型可能作用范围的一部分,甚至是一小部分。因此,本文试图给出实践中大模型的应用引入原则,即如何判断究竟在哪些地方适合尝试引入大模型进行提升或改造。这里认为,相关的原则讨论比具体的场景介绍还要重要,它可以在实践中有效地指导产品或者研发的判断,从而将有限参考的作用转变为无限挖掘的支持。

     1. 原则1——可控大模型与有界智能体

这里认为,在相当一部分如金融行业这样的垂直领域,纯原生大模型能力的直接使用,与如Manus那样无边界的、完全自主智能体的思路,在相当长的一段时间内,还行不通。说不清楚到底对不对的状态,不是一个阶段性的临时过渡,而是现有大模型能力与ReAct框架固有的缺陷。在金融行业,很多业务流程的灵活是有边界的,受到业务规划的精准约束,并不需要也不能由大模型完全自主规划,一定要用准确的行业数据、精准的业务流程与人为经验的判断,包括监管规则的加持,把大模型与智能体装进笼子里,即推广可控大模型与有界智能体的价值观与方法论;

      2. 原则2——精耕细钻

就是说,在探索挖掘大模型应用场景时,不要停留在整个场景的宏观层面,比如:“能否用大模型实现智能决策?”“能否实现智能营销?”“能否实现智能风控”,对此类回答“是”或者“否”往往没有太多的意义。应该对要提升与改造的场景的实现流程、分支步骤的实现方法、所依赖的数据与工具等进行细粒度的分解与分析,每一步、每一点都探究下是否可以使用大模型进行提升,所谓“精耕细钻”;

        3. 原则3——“人”“智”增替

那么,在实施“精耕细钻”的过程中,究竟怎么判断哪个环节适合引入大模型呢?这自然需要具体问题具体分析,很难给出一个统用的答案。但是,本文认为,以现阶段大模型的能力表现来看,倒是可以总结相对通用的原则:凡是依赖人类手工的工作,或者人类专家经验的环节,都有可能基于大模型进行智能增强或者替换,所谓“人”“智”增替。也就是说,如果有某项工作过去一直无法避免大量的人工耗费,现在大模型就很有可能大幅减少人工甚至实现完全自动化;如果有某些环节过去必须依托专家经验的亲自参与才能取得较好的效果,现在大模型就有较大概率在一定或者很大程度上替代专家经验。

        4. 原则4——使用“得当”:

在以上三个原则的基础上,使用大模型时,一定要注意使用“得当”。即不要为了用而用,一定注意将其使用在其能力适当的地方。在仔细分析应用流程的基础上落地大模型时,传统的方法与经典机器学习(有些人称“小模型”)是很有可能在某些需求上更准确更适合的,可能有些地方使用过去规则式方式更合适(例如一些风险的判别),可能有些地方使用经典统计学与机器学习方法更合适(例如一些风控指标的计算),那就需要结合使用。这实际上也正与智能体Agent开发结合大模型鼓励使用“工具”的思路相吻合。

总之,笼统的讲大模型适用不适用哪个场景意义不大,应该在“精耕细钻”的基础上,以人”“智”增替、使用得当为原则进行判断,可以作为大模型的应用引入原则标准,从而有效地指导大模型的应用推广实践。

当然,这并不是说所有符合原则的情况都一定能通过大模型得到明显的成效,只是说这些地方值得仔细研究与尝试,但却可以帮助我们避免大量不必要的尝试。例如复杂的数学计算,分明是可以直接调用相关的软件包或接口来实现,目前看用大模型的必要性显得不是很大。另外这也只是大模型现阶段在工程实践中的应用引入原则,在科研领域,则不应该受此限制。

五、大模型的能力边界分析

有了大模型的应用引入原则之后,还需要讨论一下大模型的能力边界,或者准确地讲是指现阶段大模型的工程能力边界,这也是有助于更进一步界定应该在什么时间、什么程度上应用大模型。需要限制在工程而非科研领域。因为大家经常会看到一些介绍或探索大模型非凡能力的文章,但有可能是在科研领域内。严格来讲,在科研领域,可以是无所不能的,但在工程实践中是否适用,实际是个问号。现在来尽量准确回答这样一个问题:大模型究竟能做什么,擅长做什么,不能或者不擅长做什么?

首先,让我们还是来探讨一个本源问题:大模型的核心能力究竟是什么?本文认为,尽管大模型有很多具体的能力,但其最根本的进步是:

  1. 大模型大大简化了从数据中获取信息(知识)的过程
  2. 大模型大大扩大了从数据中获取信息(知识)的范围
  3. 大模型可以有效地生成数据,消费数据,从而将数据由人类生产/人类消费的阶段推进到机器生产/机器消费的新阶段,极大程度地提升了数据驱动进步的能力

这里的数据是广义的,包括了普遍理解的结构化非结构化数据,自然语言,代码,计划,决策,函数等等。就拿普遍意义的数据为例来讲,过去,从数据中获取信息,主要是依靠BI,它只能回答“是什么”;当我们需要从数据中挖掘超越“是什么”的信息(知识),发现更多的数据关联时,就需要采用经典的统计学与机器学习方法,正如前文所说,它并不好用,难以普及,效果欠佳。而简单来讲,大模型则赋予了我们随处、方便地挖掘信息(知识)的能力(当然,现阶段,它有时并不准确),正所谓AI可以无处不在!从这一点,也可以感觉到大模型应该可以使现有的金融科技应用体系产生明显的升级。

需要指出的是,目前火热的智能体Agent,包括MCP体系,其实本质是大模型与外部世界联接的一种技术框架与方法,虽然它们确实有可能会明显推进大模型红利的释放范围与进程,但并不是本源上的技术创新,这一点真正动手的大模型开发者都很清楚,这里需要特别阐明。

在本源能力的基础上,可以再来看看大模型的一些具体能力。关于大模型的对话、文档摘要与生成、翻译、情感分析等语言型能力,属于众所周知的,本文就不再赘述了,这里从如下几个方面进行分析:

  1.  对话/理解/意图识别:惊人的自然语言对话与理解进步,再扩展到多模态的音视图,是大模型最先引爆人类关注的能力,就不多做赘述;然后,进一步,大模型还擅长从语言和文档中准确识别用户意图,它对基本意图、复杂多意图、摘要生成、关联识别、实体识别、个性识别、情感识别、内容解释等多方面的相关效果都达到前所未有的水平,前文所述大模型人机交互应用大多都需要基于此实现。那么,在推进大模型应用时,除了最普遍的人机交互场景之外,对每一个具体环节,首先应该分析的就是是否可以采用意图识别进行提升,例如电商平台中从大量客户评价中总结关键客户意图信息,然后再驱动回复生成,从而极大程度地降低过去用大数据方法分析海量评价的代价;
  2. 搜录抽审写:对文档(包括多模态)进行搜索、指定要素抽取与录入、指定规则的审核,以及文档生成、总结等等,也是大模型非常突出的优势能力。除自动撰写文档外,自动从文档中抽取参数填入表格,自动审核文档是否合乎某些标准等,都可以在实践中发挥较大的实用价值;
  3. 时序分析:通常来讲,大模型的数字数据处理能力是不算突出的,虽然相关研究在不断进展中,在工程实践中,一般都应该避免用大模型处理数学与传统统计学领域内的问题。但是,由于时间序列数据与文本数据实际上都具有序列数据的共同特征,而理解和处理序列特征的能力正是大模型所擅长,Transformer架构已经被证明在各种时间序列任务中有效;加之大模型可以从文本数据中生成附加特征和生成描述性统计,从而对原始数据进行增强来提高时间序列模型的准确性;更有研究发现通过适当数据标记,大模型可以隐式理解时间模式。因此,用大模型对时序数据分析是值得在实践中关注的能力,它可以在相关预测、异常检测以及时序差值等需求中发挥作用;
  4. 关联挖掘:从多结构文本(各种格式文档,数据库,半结构化等)以及多模态数据(文、音、视、图)中,发现与挖掘数据关联,大模型表现出较过去其它方法非常明显的优势。这包括跨模态的信息融合与统一表示,识别不同模态内容之间的语义联系,捕捉不同模态间情感的一致性或矛盾之处,从不同模态数据中抽取事件并识别关系等。在工程实践中,应该重点分析是否适合引入大模型关联挖掘能力;
  5. 个性推荐:结合了用户偏好和历史行为数据之后,大模型在个性化推荐方面还表现出明显的应用潜力。它能从数据中构建很丰富的用户画像,提取较深层次的物品特征,有效处理稀疏用户-物品交互矩阵,并较好地应对新产品与用户;
  6. Function Call/工具调用:这实际上是Agent实现的关键能力之一,大模型可以根据传入的提示信息,帮助确定采用什么样的参数、调用哪一个函数或者工具接口,实现一个运作,从而将大模型的能力从想到扩展到做到。现阶段流行的MCP协议及框架其本质上是FC能力的标准化;
  7. GUI多模态:大模型可以识别图形用户界面,预测推断界面交互操作的下一步,再配合一些自动界面操作手段(如PyAutoGUI),相当程度上代理实现人类通过鼠标键盘点击输入,交互操作用户界面的过程,即GUI Agent。专门陈述该项多模态能力,是因为它的得当使用,会在大模型应用价值的释放上起到较关键的作用;
  8. 有限推理:大模型同样具有较为突出的基于已有知识进行逻辑推断和理解的能力,包括事实推理、常识推理、因果推理、概念理解、跨文档/模态推理以及推理中的情境感知等,从目前实践效果看,已经表现显著的优势,值得在应用中引入。特别是,本文认为,DeepSeek R1为代表的Test Time Compute推理型模型的发展将大大提升的大模型推理能力,这一些在后续大模型应用场景探索时要持续关注。但需要指出目前为止,大模型的推理能力目前为止同样也有很大的局限性,除了知识范围限制的之外(这一点可以通过后训练post-train、外挂知识库与上下文学习icl来增强),在处理复杂逻辑、深度逻辑及新任务泛化推理时,可能表现不佳,因此需要根据场景的特色仔细设计如何正确有效应用;
  9. 自主编排Agentic Workflow:自主行为规划是意图识别的典型进阶能力,根据识别的意图和提取的实体,模型会规划一系列行为或步骤来满足用户的需求;可以根据用户意图和上下文信息进行逻辑推理,以决定最佳行动计划;对于多个步骤任务,能够生成完整的计划;还能根据用户的特定行为、偏好、时间设定等来制定个性化、精准的行动计划。基于行为规划,再对相关应用API、包接口、搜索等集成调用,首先是智能体Agent开发的关键,而在大模型场景适用度分析时,也应该是重点考量的能力项;
  10. 数据增强:对已有数据进行增强是大模型的重要特性,能对现有数据集进行修改和扩展,并按需泛化进行数据生成。这一能力可以广泛应用于实践中语义变化、正确性检查、自动标注、数据类别平衡等需求环节。

关于大模型能力擅长,还有一个重要问题需要在工程实践中特别关注:即关于确定性的问题。目前看来,虽然可以结合专向微调,上下文学习icl/RAG,知识图谱等多种方法来提升大模型的准确率与确定性,也出现一些可喜的研究成果,但至今业界没有人、没有实践、也没有理论基础能保证大模型输出结果的可靠性,包括幻觉(Hallucinations)、思维连贯性与一致性,以及认知错误等。因此,原则上现阶段大模型不适合应用于必须精确或确定结论的场景!或者说在这种场景中,大模型的结果只能做为辅助人类判断的参考。例如金融行业的信贷决策、投资决策、风控决策、利率确定等等,不应该基于大模型向着自动或者无人化的方向努力;关于包含决策或者直接影响决策的文档与报告,也不应该完全由大模型来生成。

六、大模型的金融应用场景探讨

基于如上大模型应用引入原则与能力边界的总结,现在对大模型一些可能的具体金融应用场景进行探讨。这里认为,有如上原则指导,具体的场景其实可以不设限,但我们还是需要一个具像的列举好一些。需要指出的是,下面所有具体场景,都需要依据“精耕细钻、人智增替,使用得当”的原则在实践中仔细分析斟酌大模型的可适用度。并且即使是判断可适用的环节,也需要从数据准备、模型优化以及技术方法与架构设计几个角度不断结合实效调整迭代、深度打磨,才可能得到相对满意的效果。

对应IT架构的业务/应用,数据、技术架构分类,可以将大模型的应用(包括基础设施相关)归类到如下几个维度来列举探讨:

 6.1 智慧金融——新应用/产品(业务维度):

在金融业务维度,除了前文所述通常较先尝试的人机交互类应用外,包括智能客服(需要有代际化的质效提升)、NL2BI、自然语言用户界面LUI、文档生成/审阅、问答助手等,大模型完全可以与更多的金融关键业务结合,推动金融业务智能化,包括但不限于:

  • 业务助手:这一类总体可归结为业务Copilot的功能,即将大模型的能力(包括但不限于chat,文档处理,ReAct、推理规划等)嵌入到已有系统的使用过程中,方式可以在现有系统中增加对话入口,对业务办理过程进行协助,实现例如知识问答、参数填充、菜单导航、流程简化、情绪安抚、业务推荐等等功能,所谓“助手”。一般来讲,“助手”类应用可以嵌入绝大多数已有的系统中,包括但不限于:
    1. 投顾/投研/财务规划:该方向的适用度无需过多赘述,关键是在工程实践中做优做精;
    2. 业务/营销辅助:在流程细节中“得当”地使用大模型,可以对客户进行金融产品的业务协助与个性化推荐,特别是个性化推荐,大模型表现出明显优于传统机器学习或者规则引擎的能力,可以根据客户、产品资料的数据特点,已完成功能的不足与需求分析,以及所在场景的具体情况,将大模型与其它方法进行整合、集成设计,应该可以相当程度上提升营销推荐业务的水平与效果;
    3. 客户/产品分析:在金融客户经理相关系统中,引入大模型作为辅助,结合大量的客户/产品信息、接触历史与交易行为,以及相关文音视图资料,综合分析客户/产品画像,偏好辅助业务执行,是一个不错的选择;
    4. 业务流程自动化:通过大模型对语言意图准确识别与分解后,结合智能Agent技术,实现金融业务流程自动化,是一个相对通用的场景。经过仔细的业务分析与工程开发,大模型有条件将金融业务流程自动化推进到一个新水平;
    5. ChatBI(决策助手):ChatBI顾名思义,用自然语言实现可视化BI,包括智能问数、归因分析、趋势预测等能力。需要指出的是:ChatBI与NL2SQL不是同一件事,实践证明,采用NL2SQL的思路很难甚至不能实现工程级别准确度要求的ChatBI,这一些需要明确。
  • 文档助手:各种文档类(多模态)的搜、抽、审、写,都是比较实效的应用方向;
  • 金融业务智能体:智能体是对大模型发散能力有效约束,并能够产生业务实效的重要方向。不过要注意的是,金融乃至产业的智能体,一定不是指一些增加了大模型能力的交互编排工具,也一定不是无边界的Manus,而应该是在业务规则约束下的Domain-Oriented有界Bounded Agentic System,它以自主动态编排与执行为主体,是多Agents协同的金融AI能力中心,是新一代的金融超级入口,有望真正实现创成式场景的跨内外、跨条线能力组合式创新(产品动态创新的概念提出已久,如从超市选货般的组装新的应用能力,而从SOA到微服务编排,以前从来没有真正实现过);
  • 教育培训:用大模型提升教育培训类业务的质效,无疑也是可以带来明显效益的方向,值得关注;;
  • 其它应用:还有一些在现实中还属于探索阶段,但分析属于大模型能力可及范围内的场景,包括但不限于:
    1. 风险评估/控制/异常检测:除了依据前文原则,在详细业务流程中仔细斟酌引入大模型的适当用途外,能否将大模型用于风险评估的关键/决策环节,是值得仔细商榷的。由于金融风险评估的关键/决策环节一般都要求较好的稳定性、准确性与可靠性,因此大模型通常被认为是不适当的。但是,起码大模型能够从丰富的多模态数据中提取风险评估对象的特征与关联信息,这无疑能明显增强现有风险评估与评分方法的能力;另一方面,研究表明,大语言模型在执行各种预测任务方面表现出了突出的能力,采用其预测能力获取可靠的风险评分应该也是一个值得关注探索的方向;
    2. 价格预测:有研究表明,大模型在时序数据的特征提取与分析方法表现出相比LSTM、CNN以及经典统计模型不俗的能力。因此,可以探索采用大模型对具有明显时序特征的产品(如股票)价格进行预测的相关应用场景的适用度;
    3. 金融业务环境模拟:目前处于研究热点的多Agent代理交互技术,还可以广泛用于例如信贷、股票交易对手的模拟,宏观经济活动的模拟等场景,甚至实现更加复杂的金融市场、交易与经济活动模拟,从而有效提高金融工作与决策的质效。但现阶段,应该作为关注的研究方向,在工程中的实际使用应该还要假以时日。

6.2 数据智理——新数据(数据维度):

数据“智”理是通过对传统数据治理体系的智能化提升,推动打造数智融合的新型金融数据体系。包括但不限于:

  • 从“治”理到“智”理:金融数据治理是典型的手工与专家经验重度参与的工作,包括数据标注、补全、分类,标准的制定、落实与维护,质量异常的规则制定、发现与修正,元数据侧写、标签与血缘发现构建等等,都需要大量的人工干预。实践已经证明,大模型在这里可以发挥较大的作用,相当程度的替代人为经验,实现高自动化水平的数据预处理、数据标准、数据质量、元数据管理等,并且可以提供潜在数据关联挖掘、数据增强与生成,以及多模态数据综合治理等升阶的能力,将金融数据治理推进到数据“智”理的层次;
  • 统一、主动Unified Catalog:由元数据进阶到面向全结构多模态跨地域、跨库统一管理、主动保鲜的Catalog,是大模型与AI驱动的数据领域较先进的发展方向;
  • 数据与智能融合的一体化数据平台:由数据平台统一承载AI负载,由仓内智能,统一SQL入口将AI4Data,Data4AI融合,多模态全结构数据融合,形成数智融合的一体化数据平台是目前湖仓平台发展的新方向;

6.3 开发运维——新技术(技术维度):

  • 代码辅助生成,测试用例生成,研发文档与流程辅助等
  • 智能运维机器人

6.4 新基建:

  • L2级场景大模型,这将是大多数金融科技服务商的重点
  • L1级金融行业大模型(充分结合发挥自有数据资源优势)
  • 相关中间件/平台与实时交互API

6.5 其它

  • 管理:有研究表明大模型在企业绩效管理中可以发挥相当的正向作用;也可以用多智能体来模拟组织结构,探索验证创新的组织管理方法
  • 除如上列举之外,大模型还可以在数据库查询优化(如通过学习历史模式智能生成查询计划、智能索引优化、智能缓存管理等),集群效能分析(如SQL资源占用分析、集群资源扩缩需求量化分析等),安全审计,隐私保护等等很多方面发挥作用,只要遵循上文引入原则仔细分析,其可适用的场景可以是非常广泛的。

七、发展策略探讨

这里对金融行业,特别是金融科技企业的大模型发展策略进行探讨。首先,前文所列场景只说个方向实际还是很不够的,需要在实践中探索;另外,所列部分场景是对一些研究报告的参考,并非都是笔者本人的实际经验,因此实践中还需要仔细探讨斟酌;同时,这些列举更多是尽量全面的能力分析,并不是建议企业都去做。

关于金融科技企业的大模型应用发展策略,本文提出如下几点建议,以供参考:

  1. 应用驱动,模型支撑:以产生实效的大模型应用精品为主体驱动业务推进与拓展,以场景大模型/行业大模型拓展与推进为支撑,甚至是辅助;
  2. 充分发挥行业特色数据资源优势:充分发挥集团已经拥有的金融特色数据资源优势,对内支持优势产品研发,对外数据资源驱动市场拓展;
  3. 精品/标品策略:虽可广泛探索研究,但产品上不贪多,专门打磨有特色高质量的精品,可复制的标品;
  4. 小型化策略:结合具体应用特点,策略性地设计开发“专小廉”的AI应用一体机;
  5. 合作策略:在关键场景研发上,选择与关键客户紧密合作,紧密依靠业务专家在实际场景中精打细磨,仔细分析,迭代沉淀有实效的产品;在L1级行业大模型开发方面,建议与关键金融客户联合共创。
  6. 推进策略
  • 对已有应用,把握客户,做精做强,抽象标品,尽快拓展;
  • 加快设计打磨在强人机交互类之外(智能客服、文档助手等)少而精的典型应用场景

八、结语

大模型在金融领域的应用场景还在持续不断的探索中,这种探索首先应该遵循对场景流程精细分析,以及尽量减少人工干预的原则,以可控大模型与有界智能体的价值观与方法论,同时参考大模型已被证实有效的能力边界来做决定。除了较为普遍的人机交互类场景以外,大模型可以在金融数据智理、客户分析、营销推荐、价格预测、异常检测、风险评估、流程自动化以及金融场景模拟等方面发挥不同程度作用,但如何有效的在这些场景中正确引入大模型,需要依据细粒度上下文情况,结合大模型的技术特点做仔细业务分析与产品设计。并且具体的工程实现方法,包括数据预处理、模型调优、上下文相关学习、训练技巧、技术架构、经验总结并不断迭代优化等非常关键。总之,简单停留在宏观描述层面某个场景讲行与不行,没有太大的意义。大模型在金融行业的应用市场前景巨大,应该结合自身特色,广泛探索,重点打磨,以应用为先导,以模型为辅助,以数据为特色;以私有化部署结合联合运营行业SAAS服务、自运营数据产品服务的模式,尽快占据并引领数智金融行业应用的升级

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐