机器学习之Overfitting和Underfitting
什么是overfitting和underfitting?
Overfitting是指模型在训练数据集上的表现比测试数据集上的表现好 。
Underfitting与overfitting相反 , 是指模型在测试数据集上的表现比训练数据集上的好 。
下图中横轴表示训练时间 , 纵轴表示error , 蓝色线条表示训练集 , 红色线条表示测试集 , 随着训练时间增加训练集上error逐渐降低 , 而测试集上一开始降低 , 到了一个点以后反而开始升高 , 这时模型开始overfitting 。 反过来就是underfitting 。
文章插图
无论overfitting还是underfitting , 都不是好的模型 , 都不能对真实世界的数据做出正确的预测 。
什么情况会导致overfitting和underfitting呢?
模型太过复杂往往会导致overfitting , 就如下面右图中显示的 , 模型过度拟合数据 , 导致模型太过复杂 , 不能真实反映实际情况 。
模型太过简单又会导致模型不能很好的学习数据结构 , 导致underfitting 。 如下面左图 。
中间的模型很好的反映了数据的真实走势 , 是一个好的模型 。
文章插图
避免overfitting的方法:
- 通过简化模型 , 比如减少模型参数;
- 增加训练数据集;
- 减少训练数据噪音 , 比如去除outlier 。
- 选择更复杂的模型;
- 筛选更好的数据特征来训练模型 。
- 开发自|不妥协不追随 Member’s Mark升级背后的“山姆哲学”
- 机器人|网络里面的假消息忽悠了非常多的小喷子和小机器人
- 跑腿|机器人“小北”上岗 让办事群众少跑腿
- 计算机学科|机器视觉系统是什么
- 阿尔法|击败李世石的AI公司,又研发出生物版“阿尔法狗”:破解50年生物学难题
- 机器人|外骨骼康复训练机器人助力下肢运动功能障碍患者康复训练
- 互联网|政企学界人士西安共议数字经济 产业互联网发展向“西”行
- 高学历|薇娅一夜带货53.2亿,少不了这支高学历团队!
- 教学|机器人教学的目标方案
- 体验|VR\/AR体验、3D打印、机器人“对决”……松江这所中学人工智能创新实验室真的赞