- 数据科学与机器学习:数学与统计方法
- (澳)迪尔克·P.克洛泽等
- 143字
- 2024-11-03 18:26:35
2.5 估计风险
对式(2.5)的泛化风险进行量化的最直接的方法是通过式(2.7)的测试损失来估计它。然而,泛化风险本质上依赖于训练集,因此不同的训练集可能产生显著不同的估计结果。此外,当可用数据有限时,保留相当一部分数据用于测试而不是训练可能不太经济。本节将考虑不同的风险估计方法,旨在规避这些困难。
对式(2.5)的泛化风险进行量化的最直接的方法是通过式(2.7)的测试损失来估计它。然而,泛化风险本质上依赖于训练集,因此不同的训练集可能产生显著不同的估计结果。此外,当可用数据有限时,保留相当一部分数据用于测试而不是训练可能不太经济。本节将考虑不同的风险估计方法,旨在规避这些困难。