• Zoey
    2021-04-07
    ROC 曲线的横坐标为假阳性率 FPR、纵坐标为真阳性率 TPR,计算公式为 FPR = FP / N,TRP = TP / P,其中 P 是真实的正样本数量, N 是真实的负样本数量,TP 是 P 个正样本中被分类器预测为正样本的个数,FP 是 N 个负样本中被分类器预测为负样本的个数。 以一个医院诊断病人为例,假设有 10 位疑似感染患者,其中 3 位很不幸诊断阳性(P = 3),另外 7 位诊断阴性(N = 7),对于诊断阳性的 3 位患者,其中有 2 位确实是真正的患者(TP = 2)。 这个例子好像不太对,公式里的P是真实正样本数量,但例子里P是诊断出来的正样本数量?感觉画混淆矩阵缺信息? | P | N | 诊断 ----------- T | 2 | | ----------- 真实 F | 1 | | ----------- | 3 | 7 | 10

    编辑回复: 根据题目可以得到混淆矩阵吗,混淆矩阵:TP = 2,FN = 1,FP = 1,TN = 6,所以可以得出正样本P = 2 + 1 = 3,负样本 N = 1+ 6 = 7,所以 TPR = TP / P = 2/3,FPR = FP / N = 1/7。 对于分类器来说,这组分类结果就对应 ROC 曲线上的一个点 (1/7, 2/3),最后,由分类器计算出来的多个点组成 ROC 曲线。

    共 3 条评论
    2