# 前言 最近在做模型评估,看到有论文涉及到 18 折交叉验证和 F1 分数以及宏观 F1 分数,有点被搞晕了,遂查了些资料,记录于此 # K 折交叉验证 K 折交叉验证实际上可以有两种功能,模型选择,和模型评估。参考:N 折交叉验证的作用(如何使用交叉验证) 重点如下: N 折交叉验证有两个用途:模型评估、模型选择。 N 折交叉只是一种划分数据集的策略 **。**...
# 过拟合问题 # 欠拟合 当 train acc. is bad 并且 test acc. is bad as well 可以认为是欠拟合,但现在神经网络的学习能力太强了,所以这种问题不常见 # 过拟合 当 train loss and acc. is much better 但是 test acc. is worse 就是过拟合,也就是泛化能力 Generalization Performance 不够,所以目前的主要问题就是如何缓解过拟合问题 # 训练 / 验证 / 测试集的划分 对于测试集,我们不能做任何事情,所以通常来说将训练集划分为训练集和验证集 #...