对于模型评估问题,在留出法和交叉验证法中,由于保留了部分样本用于测试,因此实际评估的模型所使用的训练集比 小,会引入因训练样本规模不同而导致的估计偏差。由此引入「自助法」(Bootstrapping)
显然,样本在 次采样中不出现在训练集 的概率为
即通过自助采样,初始数据集 中约有 的样本为出现在采样数据 中。