最新最热乎的大模型应用面经

当前，AI大模型技术正推动各行业智能化转型。该教程通过"应用-开发-算法"三位一体的学习路径，帮助学习者系统掌握大模型核心技能。从工具使用到模型调优，七天集训聚焦真实业务场景的解决方案，完成从理论到实战的能力跨越。把握技术变革窗口期，这场高效学习将为你打开AI工程师的职业通道，赋能未来技术生涯的持续发展。

黑客Zion

1032人浏览 · 2025-07-23 22:08:25

黑客Zion · 2025-07-23 22:08:25 发布

有人觉的面经很简单，可以看我 *面试内容 & 难度* 的说明。

# 大模型应用开发面经

## 时间范围

近半年

## 实际面过的公司

阿里、腾讯、美团、字节、快手、同程、京东、360、keep、滴滴、印象笔记、作业帮、彩云科技、蓝色光标、江城互娱、Aviagames、Hungry Stdios、深言科技、即时科技、RockFlow、格灵深瞳、百融云创、印象笔记、网龙、 HiDream.ai、昆仑万维、数驱互动、Authing

## 先说总结

### 面试内容 & 难度

- 个人觉得，在llm应用的面试题上，没有太多复杂、高深的问题，不像上来让你说一下分布式锁怎么设计然后死扣设计细节或是描述一下MVCC原理这种偏高难度的八股文问题（当然也遇到了一两次），究其原因以下几点，一是大模型应用目前仍没有很成熟且被广泛接纳的方案，都还在探索；二是很多公司今年刚开始all in AI（我司all进去的比较早点），面试官其实大部分也是在边面试候选人边探索，例如RAG这个东西，大部分的面试题无非是“你觉得RAG中最难的是什么？（文档切割）”、“你是怎么解决幻觉问题的？”，“微调和RAG的区别是啥？”等等，如果你做过RAG加上你经常看技术文章结合你的“侃侃而谈”，基本面试官都觉得ok。但这里着重说一下我觉得当前非常重要且极大概率提升面试通过率的的一个技术点，就是掌握微调原理并且做过动手做过微调工作再加上动手部署过大模型，这是我面试中最常被问到而又只能说没做过的问题，当然大部分公司都有专门的算法团队去做这件事，自己到没机会参与其中，也是可以理解的。

- 算法题：一半是DP问题，还有一部分难度是easy的问题，总体上都是“老熟人”，但是，你即使写出来，面试不一定就能过，有的干脆就不考算法题。

- 八股文：明显比之前少很多，这个和面试的岗位有关系，LLM应用的岗位更偏实践，所有很多一面就是leader面，直接问项目，除非一面也不懂LLM的东西，就会考八股文，但总的来说，八股少了，但是绝对不可以不准备，好几次挂在这上面，别小瞧它。

- 岗位内容：

- 游戏公司：一般上是LLM + BI for 游戏策划；游戏社区客服助手；

- toC: Agent 个人助手

- toB: Agent for 解决方案

- other: 通用 Agent 平台；公司内部AI助手、平台；Agent for 运维

### offer

- 会有很多横向对比，如果你期望薪资比较高，对方说要在等等，基本上凉了。

- 大部分涨幅基本是不到20%的，但我的期望是30%左右，最后还是拿到了（要有一点点耐心，还要有一定的运气）。

- 不要眼高手低，先拿一个低于自己预期的offer，再慢慢谈，前提是公司想要你。

- 规划好时间，集中面试，集中对比，由于我时间线拉的过长，后面安排的很乱。

### 再总结

- 每次面完都要复盘，没答好的问题，一定要重新梳理答案。

- 没把握问题的可以直接说不会，别给个你自己都听不懂的答案。

- 简历一定要让大模型润色，但自己要check一遍，别吹过头了。

- 多看技术文章，扩展技术视野，提高二面面试官对你的印象。

- 表达一定要流畅清晰，不要断断续续的，面试官会觉得你思路不清晰。

- 项目效果评估是个很重要的问题，不管你的技术多炫酷，终究还是要看效果，看落地效果。

## 面试题

> 这里想到多少写多少

### LLM 基础

- 大模型是怎么训练出来的？

- Transform 的架构，Encoder 和 Decoder 是什么？

- Function Call 是怎么训练的？

- 微调的方案有哪些？自己做过没有？

- 大模型分词器是什么？

- Embedding 是什么？你们用的那个模型？

### Lib

- 介绍一下 langchian

- 介绍一下 autogen

- 有没有用过大模型的网关框架（litellm）

- 为什么手搓agent，而不是用框架？

- mcp 是什么？和Function Call 有什么区别？有没有实践过？

- A2A 了解吗？

### Prompt

- ReAct 是啥？怎么实现的？

- CoT 是啥？为啥效果好呢？有啥缺点？

- Prompt Caching 是什么？

- 温度值/top-p/top-k 分别是什么？各个场景下的最佳设置是什么？

### RAG

- 你介绍一下RAG 是什么？最难的地方是哪？

- 文档切割策略有哪些？怎么规避语义被切割掉的问题？

- 多路召回是什么？

- 文档怎么存的？粒度是多大？用的什么数据库？

- 为啥要用到图数据库？

- 向量数据库的对比有没有做过？Qdrant 性能如何？量级是多大？有没有性能瓶颈？

- 怎么规避大模型的幻觉？

- 微调和RAG的优劣势？

- 怎么量化你的回答效果？ 例如检索的效果、回答的效果。

### workflow

- 怎么做的任务拆分？为什么要拆分？ 效果如何？怎么提升效果？

- text2sql 怎么做的？怎么提高准确率？

- 如何润色query，目的是什么？

- code-generation 是什么做的？如何确保准确性？

- 现在再让你设计你会怎么做？（replan）

- 效果是怎么量化的？

### Agent

- 介绍一下你的 Agent 项目

- 长短期记忆是怎么做的？记忆是怎么存的？粒度是多少？怎么用的？

- Function Call 是什么做的？

- 你最大的难题是什么？你是怎么提高效果的？怎么降低延迟的？

- 端到端延迟如何优化的？

- 介绍一下single-agent、multi-agent的设计方案有哪些？

- 反思机制是什么做的？为什么要用反思？

- 如何看待当下的LLM应用的趋势和方向

- 为什么要用Webrtc？它和ws的区别是什么？

- agent服务高可用、稳健性是怎么保证的？

- llm 服务并发太高了怎么办？

### 系统设计题

- 短链系统

- 分布式锁的设计

- 给你一部长篇小说，怎么做文档切割？

- 怎么做到论文翻译，并且格式尽可能和原来的统一

- 游戏社区客服助手设计。如何绑定游戏黑话，如何利用好公司内部的文档

- 结合线上问题快速定位项目工程代码有问题的地方

- 有很多结构化和非结构化数据，怎么分析，再怎么得出我要的结论。

### 八股

- go的内存分配策略、GMP、GC

- python 的内存分配策略、GC

- redis 用过那些？mget 底层什么实现的？、zset怎么实现的？

- mysql 索引怎么设计最好？数据库隔离级别？mvcc是怎么实现的？

- 分布式锁是什么实现的？

- kafka的 reblance 是什么？会产生那些问题？怎么保证数据不丢?

- fastapi 设计原理？

- go 中 net/http 如何处理的tcp粘包问题

- http2 是什么？比http1.1有什么优势？

- Linux 网络性能调优的方式

- 如何定位Linux中的pid、端口号等等

为什么选择AI大模型领域？

AI大模型是人工智能领域的下一个制高点，它不仅推动了技术的革新，也为从业者提供了广阔的发展空间。

高薪岗位：大模型应用开发工程师、大模型算法工程师等岗位薪资远超传统程序员。
职业前景：AI技术正在重塑各行各业，懂AI的程序员将更具竞争力。
技术深度：AI大模型领域需要扎实的编程基础，你的程序员背景正是转型的核心优势。

程序员转行AI大模型的三大核心优势

编程基础扎实
你已经熟练掌握Java、C++、Python等编程语言，这是AI大模型开发的基础技能。
逻辑思维清晰
程序员的思维方式与AI开发高度契合，你能够快速理解复杂的模型架构和逻辑。
学习能力强
你习惯于解决问题和学习新技术，这正是AI领域快速发展的关键。

AI大模型的岗位与薪资

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：

算法工程师：负责模型训练优化，年薪普遍30-80万，顶尖人才可达百万；
提示词工程师：设计指令让大模型精准输出，月薪2-5万；
数据标注师：清洗训练数据，月薪0.8-1.5万；
AI产品经理：对接技术与场景需求，年薪25-60万。
CV工程师（视觉大模型）：开发图像/视频理解模型（如Stable Diffusion），年薪25-60万；
NLP工程师（语言大模型）：优化文本生成逻辑，年薪30-80万；
机器学习架构师：设计分布式训练框架，年薪60-150万。
模型压缩工程师：把千亿模型“瘦身”到手机运行，年薪40-70万。
据某招聘网站数据，2024年大模型相关岗位数量同比暴涨230%，北京、深圳、杭州成为三大人才高地。