开篇词｜知识工程：AI时代的软件工程

徐昊



讲述：徐昊大小：8.70M时长：09:30

你好，我是徐昊，欢迎你和我一起学习 AI 时代的软件工程。
随着 2022 年底大语言模型（Large Language Model）进入技术爆炸期，LLM 也对软件研发产生了巨大的冲击。无论是使用 ChatGPT 直接从头生成应用，还是在 Github Copolit 辅助下在已有代码库中编码，每一次与 LLM 有关的新闻都刺激着从业人士的神经，好像过不了几天，工作就会被 AI 取代了。
通过 ChatGPT 编写生产代码然而实际使用起来，是怎样的呢？让我们看一个例子，如果要做一个产品目录的服务（Product Catalog），通过 API 的调用返回产品信息。这是一个非常简单的 RESTful API 服务。大多数人可能会想到通过下面的提示词（Prompt），让 ChatGPT 帮助我们编写代码：
目前我们在编写一个产品目录服务，通过API提供所有可售商品的详细信息，使用Java编写。
请提供代码和对应的功能测试。
在这个提示词中，我们简要地描述了需求。因为 ChatGPT 的回答并不是确定的，以下是我得到的结果：
比起可以使用的生产代码，这更像一份在给定上下文（产品目录）下的 Spring Boot 教程。离生产代码还有很大差距。我们需要在现有结果的基础上给予 ChatGPT 反馈，让 ChatGPT 做出调整。比如，告诉 ChatGPT 这个 API 不允许修改或增加目录中的产品，并要求 ChatGPT 补充其他功能测试。
需要注意的是，虽然 ChatGPT 可以通过对话保持一定时间内的上下文信息，但是如果需要更稳定的反馈结果，可以修改原始的提示词，将上下文信息包含在其中，然后重新提问。这样会获得更稳定的反馈和结果。
现在我们把反馈加到提示词里，可以这样写。
目前我们在编写一个产品目录服务，通过API提供所有可售商品的详细信息。此API不能修改或增加可售商品。使用Java编写。
请提供代码和所有功能的功能测试。
当然这个提示词的结果也许依然无法满足最后的需要，我们需要重复这样的过程，给予 ChatGPT 持续的反馈，明确我们需要修改的部分。在经过几次迭代之后，我们就会得到一个好得多的版本，当然也会有一个复杂得多的提示词，比如：
目前我们在编写一个产品目录服务，通过API提供所有可售商品的详细信息；
此API包含列出所有商品，按SKU查看某个商品，按照分类列出商品以及按关键词搜索的功能；
API返回的结果是json格式；
当查找的SKU不存在时，返回404；
按关键搜索功能使用POST而不是GET；
使用Java编写；
为所有功能提供功能测试，包括异常情况。
请编写功能和测试代码。
可以看到，为了让 ChatGPT 给出的结果更贴近生产代码，我们需要在提示词或者对话中提供丰富的上下文信息。比如在上面的提示词中就包含了大量的上下文信息。
目前我们在编写一个产品目录服务，通过API提供所有可售商品的详细信息；(业务上下文)
此API包含列出所有商品，按SKU查看某个商品，按照分类列出商品以及按关键词搜索的功能；（业务功能描述）
API返回的结果是json格式；(技术规范描述）
当查找的SKU不存在时，返回404；(技术规范描述）
按关键搜索功能使用POST而不是GET；（最佳实践）
使用Java编写；（技术栈）
为所有功能提供功能测试，包括异常情况；（代码范围）
请编写功能和测试代码。（最终的交付物要求）
在与 ChatGPT 一起完成代码功能时，我们需要通过上下文信息补充，指导 ChatGPT 生成更接近我们所需的代码。这个过程中，具体的程序编写是由 ChatGPT 完成的，而要做什么、怎么做则是由人来指定的。
从软件工程到知识工程这可能就是 ChatGPT 出现时带来恐慌的根源，在大多数程序员心中，都认为自己是搞技术的，是写代码的。现在 ChatGPT 把代码都写了，那岂不是自己就可有可无了？是不是未来都要被 AI 取代了？
这恐怕是对软件工程最大的误解了。软件工程不仅仅是编写代码。写代码在软件开发中只占很小的比例，甚至还不是最困难的根本复杂度。实际上，软件工程还涉及问题解决、需求分析、系统设计、测试和维护等方面。
这是因为软件是载体，并不是真正的产品，真正的产品是包含在其中的知识。软件只是知识的可执行形式。软件开发的核心不是产生代码，而是知识的获取与学习。
有效编码的前提是，所需的知识已经被有效地获取了。知识先存在于大脑中，然后才能体现在软件里。如果所有的知识都已经被掌握，那么编码也不会花费太多的气力。否则，开发过程就会迅速地转化为如何寻找并掌握正确的知识。
对于大多数软件开发人员来说，通过会议反复确认需求、构思正确的解决方案、查找文档、到 Stackoverflow 之类的在线社区寻求问题解答、通过调试理解存在于代码中的逻辑构成了开发工作的主要内容。与之相比，真正编码的时间反而不会太多。
而对于高水平的程序员而言，在敲下代码之前，80% 的代码都已经在头脑中构思好了。敲出来，也不过是一种必须的负担而已。所以写代码从来都不是软件开发的核心部分。
但编码的确是一个琐碎且繁杂的活动，它甚至掩盖了我们工作中最有价值的部分：获取、学习并传递知识。顺便说一句，将软件开发的过程看作知识管理的过程，强调知识作为核心产品，并不是什么新的观念。极限编程等敏捷软件开发方法就是源自这种理念的实践。
LLM 正在改变软件开发的面貌，它们可以自动化一些编码工作，但这并不意味着软件工程师的角色会消失。相反，它们将使软件工程师能够更多地专注于复杂问题的解决和创新，专注于更有价值的部分。也就是知识的获取与传递。
回想前面与 ChatGPT 一起写代码的例子，我们的主要工作，从编码转变成为 LLM 提供足够多的上下文信息。虽然我们并不需要提供详细的编码指导，也不需要指定类库或编程语言的用法，但是对于功能需求、业务知识、架构决策、测试策略等关乎“生产代码”的重要信息，还是要依赖我们，才能准确地提供给 LLM。
我们的关注点从如何构造软件，变成了如何提取组织知识，让知识变成 LLM 能够理解的形式。因此，提示词工程（Prompting Engineering）的关键并不在提示词，而在如何组织其中的知识。因而知识工程（Knowledge Engineering）是一个更合理的名字。
随着 LLM 的兴起，我们也应该使用知识工程改造软件工程，即提取知识、组织知识为 LLM 更易于理解的形式，再通过 LLM 将这些知识转化为可工作的软件。
课程设计这种改变将对个人和团队都带来深远的影响。
对个人而言，从自己编码变成指导 LLM 编码。
人们常说，可以将 ChatGPT 看作一个博学肯干且情绪稳定的毕业生。那么使用类似的 LLM，就相当于公司为你配备了一个编码助理。怎么有效地发挥这个助理的能力，就成了提升效率的关键。这时我们相当于从运动员变成了教练员。对于编码技能的要求降低了，但提高了对知识总结、知识传递、任务分解等技能的要求。正如传奇程序员 Kent Beck 所言，LLM 让我 90% 的技能无用了，却让 10% 的技能放大了 1000 倍。
对团队而言，大量的知识可以通过 LLM 得到有效的沉淀。原本困扰团队的诸多问题，比如，关键岗位人才流失造成大量上下文损失；在团队中难以形成统一的共识；新人培养时间长，难以上手等问题，都会得到极大的缓解。然而直接套用 LLM 并不能有效地实现这一点，需要我们有能力将现有研发流程重新梳理为知识管理的过程，从中捕获关键知识，并通过 LLM 加以沉淀。
从知识管理的角度去看待软件开发，对于大多数人是陌生的，但是对于 AI 时代而言则是必须的。
因此在这门课中，我们主要站在知识工程的角度，阐述如何从知识管理的角度理解软件开发。在软件开发的不同阶段中，提取核心知识及关键载体，将它们表示成易于 LLM 理解的形式。其中编码阶段的知识提取和传递，将是个人与 LLM 合作的核心技能。
我们首先会介绍知识工程的整体框架。从识别软件中不同知识种类开始，讨论这些知识在传递过程中带来的认知行为改变，以及不同的认知行为适合哪种 LLM 交互模式。
然后我们会讲解在不同的软件开发生命周期中，需要传递的关键知识，以及如何将它们组织成 LLM 可以理解的形式。首先是需求分解与传递的过程，这是整个开发流程中最关键的一部分知识，LLM 可以发挥非常重要的作用。
一旦我们完成了对于业务知识的传递，就会将目光聚焦在技术和实现方式上的知识，并通过这些知识构造有效的现场管理框架。
最后是构建 AI 辅助的团队。毕竟，任何改变，只有彻底改变了团队中的人，才算是真正的落地，AI 也不例外。
希望通过这门课的学习，能帮助你更好地利用 LLM 提高效率。也可以站在一个更全面的立场上，讨论如何将 LLM 引入团队或是组织。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

AI时代的软件工程正在经历巨大的变革，大语言模型（LLM）的出现对软件研发产生了巨大的冲击。文章从ChatGPT编写生产代码的实际应用出发，指出了在与ChatGPT一起完成代码功能时，需要通过上下文信息补充，指导ChatGPT生成更接近所需的代码。同时，强调了软件工程不仅仅是编写代码，而是知识的获取与学习，软件开发的核心是知识的获取与传递。LLM的兴起使得软件工程师能够更多地专注于复杂问题的解决和创新，专注于更有价值的部分，即知识的获取与传递。因此，文章提出了知识工程（Knowledge Engineering）的概念，强调了通过LLM将知识转化为可工作的软件的重要性。随着LLM的兴起，我们也应该使用知识工程改造软件工程，即提取知识、组织知识为LLM更易于理解的形式，再通过LLM将这些知识转化为可工作的软件。文章从实际应用出发，深入探讨了软件工程与知识工程的关系，为读者提供了对AI时代软件工程的深入思考和理解。文章还掏出了LLM对个人和团队的影响，指出了LLM的使用需要提高对知识总结、知识传递、任务分解等技能的要求。同时，LLM也为团队带来了大量的知识沉淀，解决了团队中的诸多问题。最后，文章介绍了知识工程的框架和在软件开发生命周期中的应用，以及如何构建AI辅助的团队。整体而言，本文深入探讨了AI时代软件工程的变革和知识工程的重要性，对读者提供了全面的思考和理解。

2024-03-1120人觉得很赞给文章提建议

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《徐昊 · AI 时代的软件工程》，新⼈⾸单¥98

立即购买

登录后留言

全部留言(15)

最新
精选

听水的湖
置顶
购买专栏后，请添加小助手微信号：geektime004，回复「徐昊」，立即进入专栏交流群。
2024-03-11归属地：北京
2
6
JJPeng
请问老师，那10％的技能是哪方面的技能呢？我们该如何习得这部分技能呢？
编辑回复: 这门课程就在关注这部分技能呀～
2024-03-11归属地：广东

4
水木
在3月9日央视的《对话》·开年说节目上，百度创始人、董事长兼CEO李彦宏表示，以后不会存在“程序员”这种职业了，因为只要会说话，人人都会具备程序员的能力。“未来的编程语言只会剩下两种，一种叫做英文，一种叫做中文。”
作者回复: 这种论调在历史上出现过很多次，比如SQL出来的时候
2024-03-12归属地：广西
2

许凯
真心期待，一直在数字化、网络化、智能化的方向上裸奔，希望可以在智能化方面有所提升，成为今年年会ppt上的一个亮点
编辑回复: 除了ppt，更重要的是更新认识，并助力日常工作
2024-03-12归属地：江苏
2

aoe
看完第一感觉：不用担心失业了第二感觉：要用 AI 开挂了「传奇程序员 Kent Beck 所言，LLM 让我 90% 的技能无用了，却让 10% 的技能放大了 1000 倍」
2024-03-11归属地：浙江
1
14
术子米德
🤔☕️🤔☕️🤔 【R】提示词中，要提供丰富的上下文信息 = 业务上下文 + 业务功能描述 + 技术规范 + 最佳实践 + 技术栈 + 代码范围 + 交付物要求 + … 【.I.】跟ChatGPT聊天，最尴尬的事情，不是对方输出不是我所想要的，而是三轮问下来，答案我没得到，却把自己给问穷了，再也想不出问题，能够把这个对话给继续，如此尴尬之下，缓解的方式，居然是说它不行，而不是自己不灵。回头想来，尬问之后的惶恐，只有自己知道有多忐忑。这就好像，屏幕后面可能是苏格拉底、阿奎那、伽利略、牛顿、欧拉、高斯、图灵、爱因斯坦、冯诺依曼，屏幕后面的模型里携带者人类全部精英的智慧，而我，却只能跟他们聊，今天的天气怎样，不把天聊死才怪。【R】软件是载体，其中包含的知识，才是真正的产品；软件开发的核心，是知识的获取与学习，并通过软件的代码表达出来。知识工程（Knowledge Engineering），更准确表示用LLM来改造软件工程，提取组织知识给LLM，再通过LLM将知识表达为软件的代码，从自己掌握知识、自己编码，改变为掌握知识、表达给LLM去做编码工作。【Q】敲代码，软件开发的典型样子，不敲代码，总有点缺少软件开发的自信感。这样的刻板印象来自哪里？ — by 术子米德@2024年3月11日
2024-03-11归属地：浙江
2
5
打卡主持人
缓解焦虑的好课👍
2024-03-11归属地：北京

4
范飞扬
我注意到，老师用了不同的词汇，不知道是否是故意区分的？老师一开始说： “最有价值的部分：获取、学习并传递知识。” 然后说： “提取知识、组织知识为 LLM 更易于理解的形式。” 所以，想问下老师，“获取知识”和“提取知识”是一样的嘛？“传递知识”和“组织知识”是一样的嘛？如果不一样，这之间的联系是什么呢？我自己的想法是： 1、提取是获取的细化，组织是传递的细化。 2、为什么要细化？为了更好的用LLM。
2024-03-17归属地：广东

2
奇小易
收获：作为软件工程师不能只停留在编码环节，也不要被 LLM 的出现搞得自己没有未来了一样。实际情况是我们需要将关注点放到更有价值的地方，因为知识本身是为了解释世界、解决问题，软件是知识的载体，那么他们的目的都是一样，有了 LLM 之后，软件工程师能够有更多的精力去改造世界🥳。
2024-03-12归属地：湖北

1
webmin
看完老师关于软件开发核心的论述,重新审视自己的开发构建过程,确实是有大量的时间是花在获取和学习知识这个过程上. 知识管理与编码相比是一项更加通用的技能,习得此技貌似可以向更多方向上转型.
2024-03-11归属地：上海

1

收起评论