程序员的 AI 开发第一课
郑晔
开源项目 Moco 作者
717 人已学习
新⼈⾸单¥59
程序员的 AI 开发第一课
15
15
1.0x
00:00/00:00
登录|注册

04|提示工程:更好地释放LLM的能力

你好,我是郑晔!
上一讲,我们讨论了站在用户角度怎么写提示词。从使用的角度来说,提示词公式基本上涵盖了日常使用的大多数场景。但是,仅仅掌握提示词公式,对于开发一个大模型应用而言,这个公式就显得有些不够了。为了开发大模型应用,我们需要进一步扩展自己对于提示词的理解,掌握更多关于提示词的知识,这就是我们这一讲要来讨论的内容——提示工程。

提示词工程

提示工程,顾名思义,就是研究怎么写提示词。之所以有提示工程,很重要的原因就是大模型在不同人眼中做的事情差异很大。普通用户只是把大模型当作一个聊天机器人,他们的关注点是大模型能否给予及时且正确的反馈,我们上一讲提到的提示词公式就足以应付绝大多数的使用场景。
而在开发者眼中,我们需要的是大模型处理复杂任务场景的能力,比如,现在很多 Agent 背后的技术就是让大模型推断出下一步的行为,这是利用大模型的推理能力,而这依赖于提示词的编写。
大多数人是先知道 ChatGPT,然后知道提示词,再知道提示工程。但其实提示工程并不是在 GPT 流行之后才诞生的技术。提示工程最早是诞生于自然语言处理(Natural Language Processing,简称 NLP),人们发现,在任务处理过程中,如果给予 AI 适当的引导,它能更准确地理解我们的意图,响应我们的指令。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. 提示工程是研究如何写提示词的技术,旨在扩展对提示词的理解,以更好地释放大模型的能力。 2. 零样本提示(Zero-Shot Prompting)利用大模型的丰富知识,无需过多信息提示即可完成通用任务,适用于简单查询等场景。 3. 少样本提示(Few-Shot Prompting)通过给出一些例子,帮助大模型理解特定工作内容,适用于简单分类场景。 4. 思维链提示(Chain-of-Thought Prompting)旨在让大模型慢下来,进行推理和思考,提升在数学、推理等问题上的表现。 5. ReAct 框架结合了推理和行动,超越大模型自身的限制,使其能够更多地参与实际行动。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《程序员的 AI 开发第一课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(1)

  • 最新
  • 精选
  • ququwowo
    1. ReAct 框架看不太懂,后面有项目细讲嘛? 2. 最近Anthropic推出的computer use,跟ReAct有什么关系吗?https://www.anthropic.com/news/3-5-models-and-computer-use. 都是操作“工具”? 3. 文中说ReAct“具备了实现一个 Agent 的基础”, 还有没有其他主流的实现agent的框架?(除了ReAct)

    作者回复: 1. ReAct 框架会在讲 Agent 的时候再次讲到,你到时候就会看到它结合代码的用法。 2. computer use 就是一种工具,只不过具体的实现是不是 ReAct 另说。 3. 后面我们会有篇幅专门讲 Agent,推理部分有很多实现方案,ReAct 特别适合操作工具而已。

    2024-11-08归属地:美国
    1
收起评论
显示
设置
留言
1
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部