在分类器评估中,FPR(False Positive Rate,假阳性率)和TPR(True Positive Rate,真阳性率)是两个重要的指标。
FPR指的是在所有实际为负例的样本中,被错误地预测为正例的比例。它可以通过以下公式计算:
FPR = FP / (FP + TN)
其中,FP表示被错误地预测为正例的负例数量,TN表示被正确地预测为负例的负例数量。
TPR指的是在所有实际为正例的样本中,被正确地预测为正例的比例,也可以称为召回率(Recall)或灵敏度(Sensitivity)。它可以通过以下公式计算:
TPR = TP / (TP + FN)
其中,TP表示被正确地预测为正例的正例数量,FN表示被错误地预测为负例的正例数量。
FPR和TPR通常在ROC曲线(Receiver Operating Characteristic Curve)中使用。ROC曲线是以FPR为横轴,TPR为纵轴绘制的曲线,用于评估分类器在不同阈值下的性能。曲线上的每个点对应着一个特定的阈值,可以根据需求选择最合适的阈值。
在ROC曲线上,理想的分类器表现为曲线靠近左上角,即FPR较低,TPR较高。ROC曲线下的面积(AUC,Area Under the Curve)也是评估分类器性能的常用指标,AUC越接近1,表示分类器性能越好。
总结起来,FPR和TPR是分类器评估中用于衡量假阳性率和真阳性率的指标,通过ROC曲线可以综合评估分类器在不同阈值下的性能。