查全率
在数据分类性能度量中「查全率」(Recall)表示被分类为该类的样本中,真正属于该类的样本所占的比例。例如给定混淆矩阵中
- 「真正例」(True Positive,TP):测试集中是 Positive,模型预测结果为 Positive 的数据
- 「假反例」(False Negative,FN):测试集中是 Positive,模型预测结果为 Negative 的数据
为什么它会被称为「查全率」呢?这个术语的命名源自于信息检索领域,其背后的思想是希望系统能够尽可能"查全"或"召回"所有相关的信息。
因此可以理解为原本所有的 Positive 被分散到整个数据集后,分类器能够将所有 Positive 重新分类回来的比例。其中 就是被正确分类回来的, 就是原本是 Positive 但是被误认为 Negative 的,没能正确分类回来的那些样本。