成为 AI 产品经理
刘海丰
京东高级架构师
23717 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 38 讲
成为 AI 产品经理
15
15
1.0x
00:00/00:00
登录|注册

17 | 模型评估:从一个失控的项目看优秀的产品经理如何评估AI模型?

课后讨论
总结
流程优化
事故复盘
问题复现
模型评估流程

该思维导图由 AI 生成,仅供参考

你好,我是海丰。今天,我们正式进入模型评估能力篇的学习。
在开始今天的课程之前,我想请你先想一想,你在工作中推进 AI 相关产品需求的时候,是不是经常会遇到这样的问题。
在算法模型上线阶段,你拿不准到底要不要验收算法同学交付的模型,就算你想要验收,你也不知道该怎么去评估模型的好坏,只能算法同学说什么就是什么,甚至对算法同学说的名词都没有概念,非常被动。
针对这个问题,这节课,我想和你分享一个我曾经踩过的坑。我会通过我处理这个事故的过程来和你详细讲讲,在推进 AI 相关项目的时候,我们该如何去评估一个模型,怎么化被动为主动。

问题复现:一个没有经过验收的金融大数据风控 AI 产品

我先来讲讲整个事情的背景。因为 AI 在金融领域的发展一直处于引领的地位,所以基于大数据的 AI 风控产品也层出不穷。我的团队主营业务就是给金融机构做 AI 大数据风控,开发一个信用评估模型,这个产品的功能就是基于借款人的留存信息,预测他未来是否可能会逾期还款。
金融机构在给借款人放款之前会通过系统调用我们这个模型,如果模型返回“逾期”,金融机构就会拒绝借款人的贷款申请,反之就通过这个借款人的申请。下面是一个最为简单的信贷申请流程样例:
本来,上线后模型表现一直还不错。但是突然有一天,我们的客户反馈,模型对所有借款人预测的结果都是“逾期还款”,当天所有借款人向这个客户提交的贷款申请全部被拒绝了,影响的金额巨大。这样的线上事故简直就是灾难,直接导致我们客户的线上业务全部停滞。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文总结了在推进AI相关产品需求时,优秀的产品经理需要具备模型评估能力的重要性和优化流程。通过一个金融大数据风控AI产品事故案例,作者指出了未经评估的模型导致的线上事故,并对事故进行了复盘,指出了三个错误:模型上线前无评估、模型上线后无监控、特征无评估、无监控。为了解决这些问题,作者提出了流程优化建议,包括增加模型宣讲和评估节点,以及修改原有流程,增加模型宣讲和评估的环节。这些改进措施旨在提前发现模型问题,完善评估范围,确保模型的质量和稳定性。文章强调了产品经理在模型评估中的重要作用,以及建议的流程优化措施,为读者提供了宝贵的经验和指导。文章内容详实,通过具体的模型宣讲和评估环节的工作内容和交付物,以及模型验收报告的例子,为读者提供了清晰的操作指南和实际案例,有助于读者快速了解模型评估的重要性和具体操作流程。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《成为 AI 产品经理》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(6)

  • 最新
  • 精选
  • Jenny
    请问一下PSI是什么值呢

    作者回复: PSI是群体稳定性指标,我们使用PSI来衡量模型的预测值与实际值偏差大小。

    2021-01-27
    4
    3
  • 橙gě狸
    在推荐列表的场景下,一般会和业务方沟通一个简单的规则引擎用来做降级方案,避免因推荐的服务异常或结果异常导致的生产事故。 例如请求超过业务方要求的响应时间或返回的结果数量异常等等。
    2021-07-29
    4
  • Geek_d54869
    我碰到过算法同学不愿意进行模型宣讲 就不讲这个逻辑和原理 这种情况就很麻烦 只能产品经理进行模型验证 我自己看了很多论文恶补
    2023-03-15归属地:北京
    1
    3
  • h.g.
    【模型宣讲】和 【模型评估】—— 开发阶段的技术方案评审,有些团队的技术方案评审不带产品,如果把产品同学拉进来,那就跟模型宣讲比较类似了。 【模型验证】—— 确实是专业研发流程的一个新的拓展,比传统的所见即所得的测试挑战要大一些。
    2021-11-09
    1
  • 种菜的渔民
    关于特征的稳定性具体是如何评估的?一旦出现缺失,是否要写个例外或者干脆就不采用可能缺失的特征,还有就是评估也有可能考虑步骤,项目在运转过程中,如何先于用户发现模型运转的问题(监控模型运行状态)。
    2021-08-02
  • 胡文潇
    每个特征都需要算ks,iv值吗
    2021-05-01
收起评论
显示
设置
留言
6
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部