前提假设
设场景为多分类问题,测试集
准确率 Accuracy
准确率是最常用的分类问题指标,表示将样本分类正确的概率,当类别平衡的时候可以使用auc来直接评估结果。
错误率 Error Rate
错误率与准确率对应,表示将样本分类错误的概率。
混淆矩阵
相对于准确率与错误率是整体评价指标,后续的评价标准(精确率、召回率)都是对于某个类别
真正例 True Positive
表示样本的真实类别为
假负例 False Negative
表示样本真实类别为
假正例 False Positive
表示样本真实类别不为
真负例 True Negative
表示样本真实类别不为
精确率 Precision
分母为所有预测为
召回率 Recall
分母为所有真实值为
F 值 F Measure
其中
ROC曲线
以
AUC (Area under the ROC Curve)
roc曲线下面积,越大越好,常用的推荐系统排序模型评价指标,不受样本类别比例偏差影响。
参考
nndl-book
《机器学习》周志华
Comments | NOTHING