查全率

数据分类性能度量中「查全率」(Recall)表示被分类为该类的样本中,真正属于该类的样本所占的比例。例如给定混淆矩阵

  • 真正例」(True Positive,TP):测试集中是 Positive,模型预测结果为 Positive 的数据
  • 假反例」(False Negative,FN):测试集中是 Positive,模型预测结果为 Negative 的数据

则可以定义「查全率」为

为什么它会被称为「查全率」呢?这个术语的命名源自于信息检索领域,其背后的思想是希望系统能够尽可能"查全"或"召回"所有相关的信息。

因此可以理解为原本所有的 Positive 被分散到整个数据集后,分类器能够将所有 Positive 重新分类回来的比例。其中 就是被正确分类回来的, 就是原本是 Positive 但是被误认为 Negative 的,没能正确分类回来的那些样本。