【2025年AI大模型行业局势深度报告】
在人工智能和数字时代,开源不再局限于“开放源代码”,更意味着“开放资源”。AI大模型行业在2025年正处于关键的发展转折点,路径分化与开源开放的趋势将深刻影响产业格局,尽管面临诸多挑战,但随着技术的不断创新和应用的深入拓展,AI大模型有望在各行业发挥更大的价值,推动社会和经济的变革与发展。4. 完善数据科学与工程:大模型落地本质是数据工程,需重视数据规模和质量,收集、清洗、转换数据,构造指令数据,
2025年AI大模型行业局势深度报告:路径分化,拥抱开源
2025年,AI大模型领域正经历着深刻的变革,“下半场”呈现出全新的发展态势,路径分化与拥抱开源成为两大显著特征。
一、发展路径:“大力出奇迹”与“四两拨千斤”之争
一边是部分国家为维持AI领域的领先,不断在算力、数据和规模上进行激烈竞争,如美国人工智能企业xAI发布的Grok 3推理模型,其训练依赖于“Colossus”超级计算集群,消耗高达20万张英伟达GPU ;另一边则是我国AI发展路径逐渐清晰,在推进算力基础设施建设的同时,追求普惠AI,以形成差异化优势。典型代表为国内AI厂商深度求索(DeepSeek)发布的开源推理模型DeepSeek-R1,在多个基准测试中与OpenAI公司的o1模型持平,成本却仅为o1的三十分之一 ,开启了低成本训练模型的新风潮。
这种路径分化的背后,与“Scaling Laws”(尺度定律)的性价比降低密切相关。在大模型发展前期,遵循“Scaling Laws”,不断提升算力、算法和数据规模,能使大模型的智能表现实现跃升,即“智能涌现”。GPT-4时期,“Scaling Laws”性价比极高,模型效果随参数增加呈指数级提升,各大AI厂商纷纷购入高性能GPU。然而如今,情况发生了变化。例如,Grok 3的计算量是DeepSeek的几十倍,但性能提升却远未达到几十倍,这表明“Scaling Laws”的性价比在降低。中国信息通信研究院云计算与大数据研究所所长何宝宏也指出,2024年全球训练大语言模型效果普遍未达预期,OpenAI产品迭代速度放缓,意味着大模型竞赛上半场已进入“垃圾时间” 。
尽管如此,“预训练阶段的‘Scaling Laws’已经遇到瓶颈,但推理阶段的‘Scaling Laws’依然有很大机会”,田丰强调,DeepSeek正是在模型推理阶段找到了新解法,为全球AI发展开辟新路径,为大模型落地普及拓展了更广阔空间。
对于不同的发展路径,AI厂商各执一词。xAI的“Colossus”超级计算集群仍在扩张,2025年年底规模有望达50万张GPU;OpenAI等也在推进“星际之门”AI基础设施投资项目,未来4年计划投入5000亿美元 。与此同时,越来越多科研团队开始角逐低成本AI模型,如美国一研究团队研发的“s1”模型,在数学和编码能力测试中可媲美o1和DeepSeek-R1等模型,训练成本却只需几十美元。
关于哪条路径才是通向AGI(通用人工智能)的正确道路,业内看法不一。清华大学计算机科学与技术系长聘副教授、面壁智能创始人刘知远认为,极致高效、善用现有资源,走可持续、高质量发展路线才是正途;而天使投资人、资深人工智能专家郭涛则觉得,“大力出奇迹”凭借大规模数据和超强算力,更有机会模拟人类全面智能,逼近AGI,“四两拨千斤”的工程创新在特定场景高效,但难以快速拓展到全面智能程度 。近期,国泰君安、中信证券等多家研究机构肯定了算力的作用,华泰证券研报提出Grok 3证明预训练在算力提升下仍能突破,中信证券认为算力堆积仍是模型进步的关键变量之一 。
站在我国角度,“花小钱办大事”的DeepSeek路径更符合当前AI产业发展实际。一方面,国产算力芯片产能和良品率逐渐提升,未来3 - 4年有望取得较大突破;另一方面,国内企业通过软件层面的性价比优势,提升模型训练效率、降低成本,形成“剪刀差”,推动AI产业快速发展 。并且,DeepSeek的出现促进AI技术普及,带来推理算力需求增长,这为国产芯片,尤其是专用推理芯片的发展提供了机会,我国在推理芯片研发制造上具有优势,若能快速实现量产,将在全球AI芯片市场占据主动。国内AI厂商已积极行动,2月24日,阿里巴巴集团CEO吴泳铭宣布,未来3年阿里将投入超3800亿元建设云和AI硬件基础设施,总额超过去10年总和 。
二、拥抱开源开放:新趋势下的产业变革
除了发展路径的分化,2025年大模型领域呈现出的另一个重要趋势是开源开放。在人工智能和数字时代,开源不再局限于“开放源代码”,更意味着“开放资源”。在DeepSeek-R1发布前,o1模型已具备深度思考能力,但OpenAI秉持闭源策略,未公布技术方案,而DeepSeek自主探索并全面开源相关技术,引发全球热潮 。
在DeepSeek的带动下,越来越多AI厂商开始拥抱开源。2月14日,百度宣布文心大模型4.5系列将于6月30日正式开源;OpenAI表示正在讨论公开AI模型权重;马斯克宣布xAI将在Grok 3稳定后对Grok 2开源 。在2025全球开发者先锋大会上,商汤科技、MiniMax、阶跃星辰等多家企业纷纷展示最新开源模型 。
开源对企业自身意义重大,它可以吸引更多关注和使用者,激发开源社区的创新活力,推动技术快速发展,同时通过共享资源和知识,降低企业研发成本。从行业角度看,高水平模型的开源让大众免费体验优秀大模型技术能力,推动人工智能技术普及和渗透率提升,吸引更多开发者参与,共同促进行业发展。不同开源模型各有所长,保持产品开放性有助于博采众长。站在开发者视角,开源还能帮助AI大模型提高内容生成准确率,这也是未来大模型竞争的重要指标 。国内开源生态的成熟促使厂商跟进,开源大模型发布后能迅速得到云厂商、社区、芯片厂商的跟进适配,助力厂商更好地进行迭代。
大模型技术的突破离不开成熟的产业生态。我国已出台一系列政策支持和规范人工智能产业发展,北京、上海、广东、浙江等地积极构建人工智能产业生态。以上海的模速空间为例,作为全国首个大模型创新生态社区,涵盖了大模型产业链的各个环节,包括算力层、数据层、基础大模型和应用层等 。良性产业生态也离不开安全保障,近两年人工智能安全治理备受关注,中国率先出台生成式人工智能服务管理办法法规,通过相关大会加强国内外人工智能治理交流合作,共同应对风险挑战 。据艾瑞咨询研究院预测,到2028年,中国人工智能产业规模有望达8110亿元,人工智能和机器人等新兴产业将释放巨大市场潜力和发展空间 。
三、AI大模型的应用与挑战
(一)应用场景“百花齐放”
AI大模型的应用场景日益丰富,在2025全球开发者先锋大会现场,基于AI大模型开发落地的人工智能应用令人目不暇接。商汤科技的代码小浣熊2.0和办公小浣熊,为企业、开发者、个人用户提供丰富服务;宇树科技的人形机器人和机器狗吸引众多目光,机器狗在变电站巡检、消防救援等场景得到应用,降低人工作业风险,实时回传信息 。人工智能大模型已与众多场景深度融合,工业和信息化部表示2025年将实施“人工智能 + 制造”行动,加强通用大模型和行业大模型研发布局及重点场景应用 。稀宇科技(MiniMax)副总裁刘华认为,大模型应用边界仍在不断拓展,在广告、教育、客服等领域已取得较好落地成果 。我国完整的制造业产业链为大模型训练提供实操场景,开发者相信大模型应用未来还会迎来新突破 。
(二)面临的挑战
1. 复杂决策能力不足:尽管大模型在开放性闲聊方面表现出色,但在复杂决策领域存在明显缺陷。如在金融投资和医疗诊断等需要专业知识、复杂逻辑推理、任务分解、规划以及不确定性推断能力的领域,大模型难以胜任。
2. 幻觉问题:生成式大模型存在“幻觉”现象,即可能产生不准确或虚假信息,这在医疗等对准确性要求极高的应用场景中可能造成严重后果,若不解决该问题,将阻碍大模型在行业中的真正应用。
3. 领域忠实度缺乏:大模型通过互联网通用语料学习了大量通用知识,但应用到特定行业时,倾向于使用通用知识回答问题,缺乏对特定行业规范和专业知识的忠实度。
4. 不可控与难以编辑:大模型本质是统计模型,面临不可控和难以编辑的问题,随着知识更新,如何高效更新模型知识成为挑战,尤其在金融、医疗、司法等知识持续变化的行业,可控性和可编辑性至关重要。
5. 数据理解困难:大模型难以理解行业专有数据和企业私域数据,行业数据专业性强,企业内部数据具有私有性,反映企业业务习惯和命名规范,大模型对这些数据的理解存在障碍。
6. 成本问题:大模型虽然降低了在行业中训练不同模型的成本,但自身训练成本巨大,如ChatGPT一轮训练需消耗6300多万美元,且生成回答速度较慢,在大规模在线应用中会带来严重的时间成本问题 。
(三)解决方案与发展路径
1. 合理定位与流程融合:在商业应用中,将大模型视为智能引擎,驱动企业数字化转型,与企业流程无缝融合,与人类员工有效协同。
2. 知识注入与解耦:持续向大模型注入领域行业知识,将企业智能解耦为知识、能力和价值三个维度,利用大模型重塑企业信息化和数字化形态;同时解耦企业流程,将其分为提示、生成和评价三个基本环节,生成环节由大模型负责,人类负责提示和评价 。
3. 探索新落地模式:采用大模型离线处理,结合知识图谱组织信息,再通过小模型提供在线服务的模式,充分利用大模型能力,保证服务的可控性和效率 。
4. 完善数据科学与工程:大模型落地本质是数据工程,需重视数据规模和质量,收集、清洗、转换数据,构造指令数据,注重特殊类型数据使用,建立行业大模型训练语料和指令集的评测标准和筛选机制,以数据为中心进行大模型研发 。
5. 大小模型协同:发挥小模型在训练成本、使用成本、推理速度以及可控性、可编辑性、可理解性和可解释性等方面的优势,与大模型协同使用,解决不同类型问题 。
6. 模型与知识图谱协同:知识图谱中的知识可理解、可解释和可控,与大模型协同,通过挖掘思维链、检索增强、约束和检验生成结果等方式,提升大模型性能 。
7. 建立数据治理体系:从合规、安全、隐私、版权、偏差等方面治理大模型训练语料,同时利用大模型支持数据治理工作,如验证知识库知识正确性、清洗规范化数据等 。
8. 解决幻觉问题:从预训练语料准备、指令集构造、检索增强、应用到事后检验等多个环节入手,提升模型知识准确性,降低幻觉发生,如提升模型引经据典、自知之明、置信度表达等能力 。
9. 提升认知能力:增强大模型的复杂指令理解、数量推理、单位换算、逻辑推理等能力,系统性提升其认知能力 。
AI大模型行业在2025年正处于关键的发展转折点,路径分化与开源开放的趋势将深刻影响产业格局,尽管面临诸多挑战,但随着技术的不断创新和应用的深入拓展,AI大模型有望在各行业发挥更大的价值,推动社会和经济的变革与发展。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)