如何有效降低机器学习模型过拟合？

石映飞云

发布于 2025-6-4 07:02

浏览

0收藏

为什么会过拟合？

如何有效降低机器学习模型过拟合？-AI.x社区

首先需要有一个基本概念，机器学习目前还是处于统计学习范畴，即在一堆数据集（训练集）中寻找规律，然后在新的数据（测试集）预测结果，如果在新数据那预测的效果不佳但训练集效果极好，这时候我们就大概率确认是过拟合的情况。

机器学习过拟合情况.png|550

如何缓解过拟合？

增加训练集

这是一个很直接但有效的解决方案，可以想象一下，我们假定模型的灵活性很高，它很好地拟合了我们的训练集，但我们的训练集（已有的数据）无法很好把数据的真实分布（全域数据）给展示出现来，所以我们在训练集的效果很好，但跑到测试集时，效果就会差。

那这时候，我们拿更多的数据，将实际的真实分布（全域数据）展现出来，这时候模型去拟合，就可以提升整体效果。

如何有效降低机器学习模型过拟合？-AI.x社区

那如何做数据增强？我建议最好还是根据对业务问题的理解创造出新的数据。

例如，你要做的是图像识别，这时候数据增强有可能考虑随机裁剪、颜色变换、随机遮挡等，比较少会出现上下翻转或者镜像翻转这种，除非真实场景有这个需求，所以做数据增强的时候，都是根据你的真实场景去构造新的数据，来将你的训练集越变越大，尽量符合全域数据的情况（或者说你构造数据的时候，已经考虑了测试集出现的情况）。

对模型做限制

我们知道全连接网络是可以拟合无数分布的一种网络结构，正是因为模型太灵活了，所以在做梯度下降的时候，其实拟合的曲线只匹配了训练集那部分，还不能很好覆盖到测试集的情况。所以我们可以通过限制模型的可以拟合的分布情况，来快速提高模型泛化性能。

例如，假设我们知道这个数据集其实就是一个二元函数的数据集，那我们提供一个2次曲线，是不是就很容易拟合成功并且预测得很好？答案肯定是的。同理，我们在针对CV相关数据集，会一开始就考虑CNN（卷积神经网络），也是因为这个数据的先验分布我们清楚，所以用CNN这种针对图像特性处理的模型，初始效果就能比较不错。

当然也有其他方法，例如正则化、early stopping、dropout等，都可以一定程度缓解模型过拟合问题。

参考引用: [李宏毅-《机器学习》](https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.php)

本文转载自沐白AI笔记，作者：杨沐白

标签

机器学习

模型

拟合

相关推荐

OpenAI Preparedness团队首席Aleksander Madry：机器学习模型的内部计算如何将输入转化为预测？

AIGC最前线 • 3560浏览 • 0回复
机器学习有哪些类型？监督学习、无监督学习、强化学习、深度学习等等！

parson2000 • 5103浏览 • 0回复
如何在保证模型性能条件下优化Prompt降低使用成本及响应延迟？

Syrupup • 4556浏览 • 0回复
如何通过压缩提示降低GPT-4的成本

51CTO内容精选 • 3772浏览 • 0回复
简单策略解决CTR模型训练一轮过拟合问题

海因斯DK • 6961浏览 • 0回复
【机器学习】图解线性回归

鱼虫子 • 3547浏览 • 0回复
【机器学习】图解多重线性回归

鱼虫子 • 3014浏览 • 0回复
基于关系型深度学习的自助机器学习

51CTO内容精选 • 3202浏览 • 0回复
如何在组织中启用机器学习

51CTO内容精选 • 2766浏览 • 0回复
一文带你了解机器学习

宝宝数模AI • 3038浏览 • 0回复
原来机器学习那么简单—KNN回归

宝宝数模AI • 2934浏览 • 0回复
机器学习|从0开始大模型之位置编码

周末程序猿 • 3005浏览 • 0回复
2025 年：如何构建有效的智能体

zhishan15 • 1.1w浏览 • 0回复
机器学习|从0开始大模型之模型DPO训练

周末程序猿 • 3243浏览 • 0回复
新的训练范式可以防止机器学习模型学习虚假相关性

51CTO内容精选 • 2464浏览 • 0回复
机器学习 | 从0开发大模型之DeepSeek的GRPO

周末程序猿 • 3578浏览 • 0回复
原来机器学习这么简单—线性回归

宝宝数模AI • 2907浏览 • 0回复
机器学习｜MCP（Model Context Protocol）实战

周末程序猿 • 4515浏览 • 0回复
分析Anthropic元提示词，学习写出有效AI指令的关键方法

AI取经路 • 5297浏览 • 0回复

石映飞云

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

如何有效降低机器学习模型过拟合？

为什么会过拟合？

如何缓解过拟合？

增加训练集

对模型做限制

目录