

致程序员：AI 百问百答

极客时间

专家团

4216 人已学习

新⼈⾸单¥0.11



登录后，你可以任选4讲全文学习

课程目录

已更新 87 讲/共 98 讲

开篇词 (1讲)



开篇词｜在AI浪潮中，做个会“偷懒”的聪明人

时长 04:12

第一章：AI 行业全景 (25讲)



Q1｜数据底座：如何应对可能的语料库枯竭？

时长 02:23

Q2｜企业：何时/如何开始利用AI能力？

时长 04:32

Q3｜AI-first视角：AI新范式与产品表达

时长 03:52

Q4｜未来：人与AI的关系？

时长 02:11

Q5｜洞察：MCP、A2A解决了什么问题？

时长 04:43

Q6｜Agent：当前发展还存在哪些问题？

时长 02:50

Q7｜通用Agent：未来是否具备存在价值？

时长 01:49

Q8｜微调：是否将因技术发展变得鸡肋？

时长 01:12

Q9｜RAG是否已接近成熟无更多发展空间？

时长 01:37

Q10｜模型架构：多模态理解和生成的区别？

时长 02:42

Q11｜多模态：核心技术挑战是什么？

时长 03:34

Q12｜前沿探索：多模态领域研究热点有哪些？

时长 03:00

Q13｜技术路径：如何快速提升多模态效率？

时长 02:14

Q14｜技术、数据、应用：多模态下一阶段突破？

时长 03:41

Q15｜DeepSeek R1：多模态模型中Reasoning的重要性如何？

时长 01:23

时长 06:08

时长 04:49

Q18｜效率：AI辅助编程主要解决哪些痛点？

时长 05:19

Q19｜实时推理：这会带来哪些新应用场景？

时长 02:33

Q20｜端侧：算力限制是否为落地的关键瓶颈？

时长 02:54

Q21｜破局：开源霸权还是闭源终局？

时长 05:08

Q22｜关联：大模型发展与RAG技术的关联性？

时长 01:20

Q23｜技术出海：“先本土后海外”or“直接全球化”？

时长 02:29

Q24｜跨境PFM：哪些技术指标比商业数据更关键？

时长 03:41

Q25｜审视：出海前有哪些必做功课？

时长 03:34

第二章：AI 工程师相关岗位情况和能力要求 (18讲)



时长 03:11

Q27｜AI团队：是否需要组建独立AI技术团队？

时长 03:28

Q28｜人才画像：AI时代企业对研发人才技能新要求？

时长 02:56

Q29｜AI团队：岗位划分以及配合？

时长 05:13

Q30｜就业：哪些AI方向人才需求更大？

时长 05:52

Q31｜需求：企业对算法人才的要求有？

时长 06:16

Q32｜技能：算法工程师能力要求和发展重点？

时长 03:15

Q33｜差异：AI工程师与AI研究员区别？

时长 01:58

Q34｜转型：后端研发工程师必备AI能力？

时长 01:58

Q35｜价值：后端开发经验于AI系统的优势？

时长 01:28

Q36｜差别：传统开发 vs AI系统设计

时长 01:05

Q37｜技能：后端工程师是否要理解算法细节？

时长 01:59

Q38｜深度：后端工程师对AI算法的具体要求

时长 01:01

Q39｜架构：架构设计师能力要求的变与不变

时长 00:42

Q40｜软件工程：AI会给软件工程体系带来哪些改变？

时长 01:02

Q41｜核心差异：AI后端工程师 vs 纯算法工程师

时长 01:28

Q42｜潜力：AI算法+后端工程师的应用场景

时长 01:59

Q43｜跨界：AI大模型应用项目的产品经理必备能力

时长 06:48

第三章：AI 相关学习建议 (12讲)



Q44｜发展：程序员如何规划学习路径？

时长 03:22

Q45｜新动态：如何持续跟进AI领域最新技术趋势？

时长 03:48

Q46｜技术深化：如何判断哪些内容值得深入学习？

时长 02:14

Q47｜学习目标：AI底层原理是否有必要深入学习？

时长 03:41

Q48｜个人体系：如何选择AI领域各学派？

时长 01:19

Q49｜AI进阶：如何设计学习优先级？

时长 02:05

Q50｜NLP：传统的NLP在Agent开发中还有价值吗？

时长 02:13

Q51｜技术体系：AI全栈工程师的学习路径

时长 02:04

Q52｜学习方法：程序员如何快速转型为AI技术人员？

时长 02:12

Q53｜精进：参与AI开源项目对技术成长的价值

时长 02:07

Q54｜编程语言：AI领域，Python外谁主沉浮？

时长 02:42

Q55｜科研：如何选择Agent相关的研究方向？

时长 01:48

第四章：长期规划和职业护城河的构建 (8讲)



Q56｜10X程序员：如何构建“可迁移”的核心竞争力？

时长 02:18

Q57｜硬核技能：如何才能避免被AI工具所替代？

时长 02:49

Q58｜差异化优势：技术深度如何构建职业护城河？

时长 03:17

Q59｜深度积累：如何用AI扩展技术边界？

时长 02:24

Q60｜工具效能：软技能对AI发展的重要性？

时长 04:58

Q61｜基本功：长期深耕的赛道如何选择？

时长 01:52

Q62｜技术广度：通才or专才？

时长 00:53

Q63｜方向：AI应用领域创业

时长 02:12

第五章：求职与面试 (4讲)



Q64｜面试：大模型相关岗位说明

时长 04:31

Q65｜AI领域如何量化评估开源影响力？

时长 01:59

Q66｜简历：简历中如何更好地阐述项目经验？

时长 01:56

Q67｜自我认知：如何减少“空窗期”带来的影响？

时长 07:44

第六章：AI 项目实战经验 (19讲)



Q68｜AI落地：企业如何有效选择合适的场景？

时长 03:37

Q69｜AI Agent：AI原生应用和Agent的落地场景

时长 04:56

Q70｜AI应用：有哪些AI适合做的业务场景？

时长 01:26

Q71｜投资回报：AI模型带来的业务价值

时长 02:13

Q72｜选型：如何根据业务评估开源大模型性能？

时长 01:01

Q73｜调优：AI调优必备哪些技能？

时长 02:27

Q74｜封装：大模型如何API化？

时长 00:57

Q75｜自然语言：LLM转DSL

时长 01:24

Q76｜安全：商用大模型如何防泄？

时长 01:14

Q77｜Text2SQL：发展现状？挑战何在？

时长 01:10

Q78｜分析：向量库外挂是否冗余？

时长 02:44

Q79｜排查：AI效果不佳，如何自查？

时长 04:35

Q80｜AI项目实战：如何平衡模型准确性？

时长 00:47

Q81｜对接：Agent如何对接MCP服务端？

时长 00:33

Q82｜技术替代：MCP+数据库，能否替代RAG？

时长 00:34

Q83｜架构：如何设计多Agent架构？

时长 01:05

Q84｜AI驱动：算法 vs 工程怎么权衡？

时长 02:39

Q85｜评估标准：AI产品验收标准怎么定？

时长 00:59

Case1｜从数据到决策：AI驱动的Quick BI架构设计与实践

时长 32:44



致程序员：AI 百问百答





00:00/00:00

登录|注册

Q85｜评估标准：AI产品验收标准怎么定？

黄佳

作者介绍：黄佳，新加坡科研局资深研发工程师
Q：针对 AI 的产品，如何评价 AI 的产出的准确性、是否满足需要等，有哪些构建回收标准的方法或者思路？
黄佳：从大模型检索知识库或查找网页，然后生成回答的角度，分析评估指标如下。
一、标准指标评估
文本生成：BLEU、ROUGE、METEOR、BERTScore；
分类 / 决策：Accuracy、Precision、Recall、F1 Score；
检索生成（RAG）：Hit@k、MRR、nDCG、Faithfulness、 Groundedness。
人工标注 + 多维打分：人工打分维度包括相关性、正确性、语言流畅性、信息新颖性等。
二、回收标准设计方法
建立反馈机制，如“用户点赞 / 纠错”“点击率”回传给模型系统；也可有一个动态标签池定期引入高质量人工标注数据，用于校验和微调。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《致程序员：AI 百问百答》，新⼈⾸单¥0.11

立即购买

© 版权归极客邦科技所有，未经许可不得传播售卖。页面已增加防盗追踪，如有侵权极客邦将依法追究其法律责任。

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论



显示
设置



留言



收藏



沉浸
阅读



分享



手机端



快捷键



回顶部