Machine learning 增加较大数据集的MAE/MSE值

Machine learning 增加较大数据集的MAE/MSE值,machine-learning,regression,Machine Learning,Regression,首先,我想道歉,如果这不是问这个问题的最佳地点。我有一个回归模型,根据11个输入预测葡萄酒的质量。目前我的模型有平均绝对误差和均方误差结果。 但是,我使用两个具有完全相同的输入和参数的数据集。一个数据集有1600个条目,另一个有5000个条目。我的问题是,对于较大的数据集,我的MAE和MSE值更差。我的模型是否应该在增加训练集的情况下具有更好的性能 我的模型是否应该在增加训练集的情况下具有更好的性能 简短回答:没有 详细回答: 总的来说,接受拥有更多数据的假设会给你带来更好的准确性,这是正确的思

首先,我想道歉,如果这不是问这个问题的最佳地点。我有一个回归模型,根据11个输入预测葡萄酒的质量。目前我的模型有平均绝对误差和均方误差结果。 但是,我使用两个具有完全相同的输入和参数的数据集。一个数据集有1600个条目,另一个有5000个条目。我的问题是,对于较大的数据集,我的MAE和MSE值更差。我的模型是否应该在增加训练集的情况下具有更好的性能

我的模型是否应该在增加训练集的情况下具有更好的性能

简短回答:没有

详细回答:

总的来说,接受拥有更多数据的假设会给你带来更好的准确性,这是正确的思考方式。但更多的数据并不意味着你的模型变得更容易。它可能会变得更复杂。例如,您使用的是线性回归,但在某个时间点,您会意识到,使用更多数据时,回归似乎是一条指数曲线


您还需要检查新(更多)数据是否遵循原始分发。我的方法是,你用更多的数据重新训练你的模型,并把它看作一个新问题。

嗨,问这种问题的地方不对,你是对的,你应该在这里做: