04|提示工程:更好地释放LLM的能力
郑晔

你好,我是郑晔!
上一讲,我们讨论了站在用户角度怎么写提示词。从使用的角度来说,提示词公式基本上涵盖了日常使用的大多数场景。但是,仅仅掌握提示词公式,对于开发一个大模型应用而言,这个公式就显得有些不够了。为了开发大模型应用,我们需要进一步扩展自己对于提示词的理解,掌握更多关于提示词的知识,这就是我们这一讲要来讨论的内容——提示工程。
提示词工程
提示工程,顾名思义,就是研究怎么写提示词。之所以有提示工程,很重要的原因就是大模型在不同人眼中做的事情差异很大。普通用户只是把大模型当作一个聊天机器人,他们的关注点是大模型能否给予及时且正确的反馈,我们上一讲提到的提示词公式就足以应付绝大多数的使用场景。
而在开发者眼中,我们需要的是大模型处理复杂任务场景的能力,比如,现在很多 Agent 背后的技术就是让大模型推断出下一步的行为,这是利用大模型的推理能力,而这依赖于提示词的编写。
大多数人是先知道 ChatGPT,然后知道提示词,再知道提示工程。但其实提示工程并不是在 GPT 流行之后才诞生的技术。提示工程最早是诞生于自然语言处理(Natural Language Processing,简称 NLP),人们发现,在任务处理过程中,如果给予 AI 适当的引导,它能更准确地理解我们的意图,响应我们的指令。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. 提示工程是研究如何写提示词的技术,旨在扩展对提示词的理解,以更好地释放大模型的能力。 2. 零样本提示(Zero-Shot Prompting)利用大模型的丰富知识,无需过多信息提示即可完成通用任务,适用于简单查询等场景。 3. 少样本提示(Few-Shot Prompting)通过给出一些例子,帮助大模型理解特定工作内容,适用于简单分类场景。 4. 思维链提示(Chain-of-Thought Prompting)旨在让大模型慢下来,进行推理和思考,提升在数学、推理等问题上的表现。 5. ReAct 框架结合了推理和行动,超越大模型自身的限制,使其能够更多地参与实际行动。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《程序员的 AI 开发第一课》,新⼈⾸单¥59
《程序员的 AI 开发第一课》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- ququwowo1. ReAct 框架看不太懂,后面有项目细讲嘛? 2. 最近Anthropic推出的computer use,跟ReAct有什么关系吗?https://www.anthropic.com/news/3-5-models-and-computer-use. 都是操作“工具”? 3. 文中说ReAct“具备了实现一个 Agent 的基础”, 还有没有其他主流的实现agent的框架?(除了ReAct)
作者回复: 1. ReAct 框架会在讲 Agent 的时候再次讲到,你到时候就会看到它结合代码的用法。 2. computer use 就是一种工具,只不过具体的实现是不是 ReAct 另说。 3. 后面我们会有篇幅专门讲 Agent,推理部分有很多实现方案,ReAct 特别适合操作工具而已。
2024-11-08归属地:美国1
收起评论