04｜提示工程：更好地释放LLM的能力

郑晔

你好，我是郑晔！
上一讲，我们讨论了站在用户角度怎么写提示词。从使用的角度来说，提示词公式基本上涵盖了日常使用的大多数场景。但是，仅仅掌握提示词公式，对于开发一个大模型应用而言，这个公式就显得有些不够了。为了开发大模型应用，我们需要进一步扩展自己对于提示词的理解，掌握更多关于提示词的知识，这就是我们这一讲要来讨论的内容——提示工程。
提示词工程提示工程，顾名思义，就是研究怎么写提示词。之所以有提示工程，很重要的原因就是大模型在不同人眼中做的事情差异很大。普通用户只是把大模型当作一个聊天机器人，他们的关注点是大模型能否给予及时且正确的反馈，我们上一讲提到的提示词公式就足以应付绝大多数的使用场景。
而在开发者眼中，我们需要的是大模型处理复杂任务场景的能力，比如，现在很多 Agent 背后的技术就是让大模型推断出下一步的行为，这是利用大模型的推理能力，而这依赖于提示词的编写。
大多数人是先知道 ChatGPT，然后知道提示词，再知道提示工程。但其实提示工程并不是在 GPT 流行之后才诞生的技术。提示工程最早是诞生于自然语言处理（Natural Language Processing，简称 NLP），人们发现，在任务处理过程中，如果给予 AI 适当的引导，它能更准确地理解我们的意图，响应我们的指令。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

1. 提示工程是研究如何写提示词的技术，旨在扩展对提示词的理解，以更好地释放大模型的能力。 2. 零样本提示（Zero-Shot Prompting）利用大模型的丰富知识，无需过多信息提示即可完成通用任务，适用于简单查询等场景。 3. 少样本提示（Few-Shot Prompting）通过给出一些例子，帮助大模型理解特定工作内容，适用于简单分类场景。 4. 思维链提示（Chain-of-Thought Prompting）旨在让大模型慢下来，进行推理和思考，提升在数学、推理等问题上的表现。 5. ReAct 框架结合了推理和行动，超越大模型自身的限制，使其能够更多地参与实际行动。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《程序员的 AI 开发第一课》，新⼈⾸单¥59

立即购买

登录后留言

全部留言(1)

最新
精选

ququwowo
1. ReAct 框架看不太懂，后面有项目细讲嘛？ 2. 最近Anthropic推出的computer use，跟ReAct有什么关系吗？https://www.anthropic.com/news/3-5-models-and-computer-use. 都是操作“工具”？ 3. 文中说ReAct“具备了实现一个 Agent 的基础”, 还有没有其他主流的实现agent的框架？（除了ReAct）
作者回复: 1. ReAct 框架会在讲 Agent 的时候再次讲到，你到时候就会看到它结合代码的用法。 2. computer use 就是一种工具，只不过具体的实现是不是 ReAct 另说。 3. 后面我们会有篇幅专门讲 Agent，推理部分有很多实现方案，ReAct 特别适合操作工具而已。
2024-11-08归属地：美国

1

收起评论