在极端非平衡样本集的分类问题中,准确率没有太大的参考意义,主要是因为准确率无法反映出模型的真实性能。具体原因如下:
1. 假设我们有一个二分类问题,其中正样本占比仅为1%,如果我们使用一个简单的模型,将所有样本都预测为负样本,那么准确率将会达到99%。但是这个模型显然是无用的,因为它无法识别出任何一个正样本。
2. 在极端非平衡样本集的分类问题中,我们通常更关心的是模型的召回率和精确率。召回率反映了模型能够正确识别出正样本的能力,而精确率反映了模型在预测正样本时的准确性。因此,我们需要关注模型的召回率和精确率,而不是准确率。
3. 在极端非平衡样本集的分类问题中,我们通常需要使用一些特殊的评估指标,例如F1-score、AUC等,来评估模型的性能。这些指标能够更好地反映出模型在不同类别之间的平衡性,从而更准确地评估模型的性能。
因此,在极端非平衡样本集的分类问题中,准确率并不是一个很好的评估指标,我们需要使用其他更合适的指标来评估模型的性能。