LLM综述出书了!人大高瓴赵鑫老师组发布全新大语言模型中文书(附PDF)
本书主要面向希望系统学习大语言模型技术的读者,将重点突出核心概念与算法,并且配以示例与代码(伪代码)帮助读者理解特定算法的实现逻辑。由于大语言模型技术的快速更迭,本书无法覆盖所有相关内容,旨在梳理最具代表性的基础知识内容,帮助读者更好地了解大语言模型技术的核心知识点,能够快速上手相关的科研与工程项目。本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的参考资料。下载当
·
前言
本书主要面向希望系统学习大语言模型技术的读者,将重点突出核心概念与算法,并且配以示例与代码(伪代码)帮助读者理解特定算法的实现逻辑。由于大语言模型技术的快速更迭,本书无法覆盖所有相关内容,旨在梳理最具代表性的基础知识内容,帮助读者更好地了解大语言模型技术的核心知识点,能够快速上手相关的科研与工程项目。本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的参考资料。
下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

全书章节组织:
一、背景与基础知识
- 第一章 引言(大模型发展历程、重要技术概览)
- 第二章 基础介绍(Scaling Law、GPT系列模型发展历程)
- 第三章 大模型资源(开源模型、数据、代码库)
二、预训练
- 第四章 数据准备(数据收集、清洗、配比、课程方法)
- 第五章 模型架构(Transformer 结构、大模型主流架构、细节改进)
- 第六章 模型预训练(预训练任务、优化参数设置、并行训练方法)
三、微调与对齐
- 第七章 指令微调(指令数据收集与合成方法、指令微调策略与作用)
- 第八章 人类对齐(3H标准、RLHF算法、非RL算法)
四、大模型使用
- 第九章 解码与部署(解码生成算法、解码加速算法、模型压缩算法)
- 第十章 提示学习(基础提示方法、上下文学习、思维链)
- 第十一章 规划与智能体(复杂规划方法、智能体搭建方法)
五、评测与应用
- 第十二章 评测(评测指标与方法、基础与高级能力评测、评测体系)
- 第十三章 应用(概览研究领域与专业领域的应用)
下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇


魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)