提示工程(prompt engineering),简而言之,是构建和优化输入提示以引导LLMs生成准确且富有洞察力的输出的艺术和科学。在LLMs的世界里,一个精心设计的提示就如同一位经验丰富的向导,能够引领模型穿越复杂的信息海洋,找到用户心中的答案。

一、理解提示与提示工程(prompt engineering)

(一)提示的本质

提示是我们输入给大语言模型以获取期望响应的信息。它的形式丰富多样,可以是一个简单的问题、一段陈述、详细的指令,甚至可以是文本与图像等其他模态的组合。例如,在向大语言模型询问历史事件时,我们输入的关于该事件的相关描述或问题就是提示。提示的质量直接影响着模型输出的准确性和有效性,一个精心设计的提示能够激发模型挖掘出其训练数据中的深度知识,从而给出令人满意的回答。

(二)提示工程的定义

提示工程(prompt engineering)则是一门精心雕琢提示的艺术与科学。它不仅仅是简单地构造输入文本,更是涉及到对模型行为的深入理解,以及对各种影响因素的综合考量。通过不断地实验、优化,提示工程师能够设计出最适合特定任务和场景的提示,引导大语言模型生成精准、富有洞察力的输出。这是一个迭代的过程,需要不断地调整和改进提示,以适应不同的需求和模型特性。

在这里插入图片描述

二、控制大语言模型输出:配置是关键

(一)输出长度

大语言模型的输出长度是一个重要的配置参数,它决定了模型将生成的最大令牌数量。令牌是模型处理文本的基本单位,可以是单词、标点符号等。当我们需要更详细、全面的回答时,可能会希望增加输出长度,但这需要更多的计算资源。因为生成更多令牌意味着模型需要进行更复杂的计算,这不仅会导致更高的能源消耗,还可能使响应时间变长,并且增加使用成本。例如,在生成一篇长篇文章时,若设置较长的输出长度,模型将花费更多时间和资源来构建完整的内容。相反,如果我们只需要一个简短的答案,如查询一个事实性信息时,适当限制输出长度可以提高效率并降低成本。

(二)温度

温度参数控制着大语言模型输出的随机性。较低的温度值(如 0.1)会使模型的响应更具可预测性和确定性,它倾向于选择概率最高的令牌,从而生成较为保守和常规的回答。这种情况下,模型的输出更稳定,适合于需要准确、一致性答案的场景,如查询科学公式或定义等。而较高的温度(如 0.9)则引入了更多的随机性,允许模型探索更多样化的可能性,从而产生更具创造性和独特性的结果。在创意写作、头脑风暴等任务中,较高的温度能够激发模型生成新颖的想法和独特的表达方式。例如,在创作一篇小说时,适当提高温度可以让模型生成更富有想象力的情节和生动的描写。

(三)Top - K 采样

Top - K 采样基于模型为下一个令牌生成的概率分布进行操作。它限制模型仅从概率最高的 K 个令牌中选择下一个令牌。例如,当 K = 5 时,模型会在生成每个新令牌时,仅从概率排名前五的候选令牌中随机选择。这种方法在一定程度上平衡了确定性和随机性,既能保证模型考虑到最有可能的选项,又给予了一定的变化空间。在实际应用中,根据任务的需求调整 K 的值可以影响模型输出的多样性和准确性。如果 K 值过小,可能会导致输出过于局限;而 K 值过大,则可能使模型的选择过于分散,降低输出的质量。

(四)Top - P 采样(核心采样)

Top - P 采样采用了不同的策略,它不固定考虑的令牌数量,而是设定一个概率阈值 P。模型从概率分布中选择令牌,从最有可能的开始,直到所选令牌的累积概率达到或超过 P。例如,当 P = 0.9 时,如果前三个最有可能的令牌的累积概率为 0.92,模型就会选择这三个令牌。这种方法更加灵活,能够根据概率分布的实际情况动态确定选择的范围。在处理一些复杂或不确定的任务时,Top - P 采样可以更好地适应模型的预测概率分布,提供更合适的输出。它可以避免因固定 K 值而可能导致的不合理选择,尤其在概率分布较为分散的情况下,能够更准确地捕捉到关键信息。

(五)配置示例

在实际应用中,为了获得一般连贯且具有创造性的结果,通常可以从温度为 0.2、Top - P 为 0.95、Top - K 为 30 开始进行尝试。当然,这些参数并非一成不变,需要根据具体的任务需求和模型表现进行调整。例如,在一个需要高度准确和稳定答案的知识问答应用中,可能会进一步降低温度,同时适当调整 Top - K 和 Top - P 的值,以确保模型给出最可靠的回答。而在一个创意写作项目中,则可能提高温度,放宽 Top - K 和 Top - P 的限制,鼓励模型发挥更大的创造力。

最后分享

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 2024行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

在这里插入图片描述

5. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐