成为 AI 产品经理
刘海丰
京东高级架构师
23717 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 38 讲
成为 AI 产品经理
15
15
1.0x
00:00/00:00
登录|注册

22 | 模型稳定性评估:如何用PSI来评估信用评分产品的稳定性?

等距分箱
等频分箱
PSI公式中的ln部分
按时间监控模型PSI
PSI值的变化因素
持续关注模型稳定性
PSI值的可接受范围
PSI数值越小表示模型越稳定
计算PSI
计算实际分布
分箱
PSI的计算公式
客群变化影响模型稳定性
金融风控领域的稳定性要求
评估模型在不同样本下的稳定性
群体稳定性指数
观测模型是否需要迭代
评估模型的稳定性
模型性能的稳定程度
课后讨论
PSI的使用建议
PSI的业务含义
PSI指标的计算
客群变化对模型稳定性的影响
PSI指标
模型稳定性
如何用PSI来评估信用评分产品的稳定性?
参考文章

该思维导图由 AI 生成,仅供参考

你好,我是海丰。
模型稳定性指的是模型性能的稳定程度,只有稳定性足够好的模型才能通过上线前的评估,而且上线后,我们也要对模型稳定性进行观测,判断模型是否需要迭代。在实际工作中,我们会用 PSI 来评估模型的稳定性。
这节课,我们就借助一个信用评分的产品,来详细说一说 PSI 是什么,它该怎么计算,以及它的评估标准。

案例:客群变化对模型稳定性的影响

在金融风控领域,稳定性对于风控模型来说就是压倒一切的条件。模型只有足够稳定,才能既通过上线前层层的验证和审批,又能在上线后运行足够长的时间。但在实际工作中,像客群变化这类无法避免的情况,往往会直接影响模型的稳定性。
比如说,在模型上线时候,前端流量有 5000 的测试用户,模型输出的分布可能是下面这样的。如果业务设置阈值为 60 分,那么,60 分以下的人我们会拒绝放款。这样一来,模型会拒绝掉大概 20% 的人,这种情况对于业务来说是可以接受的。
如果模型上线后,前端流量没有发生变化,还是 5000 个待测用户,但是客群发生了变化,从测试用户变成了线上的用户。这个时候,模型输出的分布就会变成下面这样。
如果我们还是用 60 作为阈值,模型就会拒绝掉 50% 的用户。当前市场下,前端流量这么贵,如果风控拒绝了 50% 的用户申请,估计市场或者运营的同学,肯定不会放过风控部门了。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

PSI指标在评估信用评分产品的稳定性中扮演着重要角色。文章介绍了PSI的计算方法,包括分箱、计算实际分布和计算PSI数值的三个步骤。通过等距分箱的方式,作者展示了如何计算出PSI值,并解释了PSI值越小代表模型稳定性越高的含义。此外,文章还提供了在实际工作中使用PSI时的三点建议,包括持续关注PSI值、关注影响PSI变化的因素以及建议根据业务场景对模型PSI进行监控。最后,文章提出了一个问题,探讨了PSI公式中为何需要增加“ln(实际占比/预期占比)”部分。整体而言,本文深入浅出地介绍了PSI指标的计算和应用,对于需要评估模型稳定性的读者具有很高的实用价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《成为 AI 产品经理》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(11)

  • 最新
  • 精选
  • 加菲猫
    ( 实际占比 - 预期占比 )结果如果有正有负,SUM求和会互相抵消
    2021-04-27
    8
  • 金鱼
    在占比都比较小的情况下,采用比较后取对数,可以在消除量纲的前提下,将差别放大。作为系数乘以差值,将差异放大。
    2021-02-08
    6
  • 舞动的浅小白
    训练集(In the Sample,INS)、验证集(Out of Sample,OOS)、测试集(Out of Time,OOT)
    2022-06-27
    5
  • Geek_5a5f1e
    老师,我们是做电商的推荐产品,用深度学习模型,也实际使用计算了IV、WOE、PSI这些指标评估特征,但对结果的置信度不是很确认。这些指标主要是在机器学习使用,是否在深度学习这里也适用呢?
    2021-02-26
    2
  • Rosa rugosa
    防止PSI出现负值
    2021-03-15
    1
  • 想做产品的一帆
    请问老师,若是采用等频分箱,则计算时使用每组人数所在的阈值段占总分段的百分比去计算吗?
    2021-02-21
    1
  • Doria
    in是取对数吗
    2023-11-11归属地:北京
  • EnidYin
    为了将差别放大
    2023-11-08归属地:北京
  • 潘平
    老师,请教个问题。分类问题怎么计算稳定性呢?
    2023-09-01归属地:上海
  • Geek_d54869
    避免直接求和导致的正负抵消问题 另外就是可以避免由于样本集差异太大导致的问题
    2023-06-05归属地:德国
收起评论
显示
设置
留言
11
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部