二分类任务常用metric

发布于 2023-04-05  1.16k 次阅读


image-20230404195417312

前提假设

设场景为多分类问题,测试集,标签,使用训练完毕的模型对测试集进行预测,得到预测结果,指示函数为

准确率 Accuracy

准确率是最常用的分类问题指标,表示将样本分类正确的概率,当类别平衡的时候可以使用auc来直接评估结果。

错误率 Error Rate

错误率与准确率对应,表示将样本分类错误的概率。

混淆矩阵

相对于准确率与错误率是整体评价指标,后续的评价标准(精确率、召回率)都是对于某个类别而言,对于类别的分类结果可以有如下情况:

真正例 True Positive

表示样本的真实类别为,并且模型正确地预测为类别

假负例 False Negative

表示样本真实类别为,并且模型预测值不为,即预测为错误类。

假正例 False Positive

表示样本真实类别不为,模型预测值为,预测错误。

真负例 True Negative

表示样本真实类别不为,且模型预测结果也不为

image-20230404202628405

精确率 Precision

分母为所有预测为的情况,分子为预测为且真实值为的情况,则表示在所有预测为c的情况中,预测正确的比例为多少。表示对于每次预测为类别时,查得有多准。

召回率 Recall

分母为所有真实值为的情况(预测为且预测正确的情况加上预测为非且预测错误的情况),分子为预测为且真实值为的情况,表达在所有真实值为c的情况中,预测正确的比例为多少。表示真实值为类别时,多大的概率能预测准确。

F 值 F Measure

其中用于平衡精确率和召回率的重要性,一般取值为1.时的F值称为F1值,是精确率和召回率的调和平均。

ROC曲线

,分母为所有真实分类为非的情况,分子为预测为且真实值不为的情况。

,即召回率

为横坐标,以为纵坐标就可以绘制出roc曲线

image-20230405194656865

AUC (Area under the ROC Curve)

roc曲线下面积,越大越好,常用的推荐系统排序模型评价指标,不受样本类别比例偏差影响。

 

 

 

参考

nndl-book

《机器学习》周志华


面向ACG编程