Machine learning 如何改进消费者支出调查的预测?

Machine learning 如何改进消费者支出调查的预测?,machine-learning,data-science,random-forest,prediction,mse,Machine Learning,Data Science,Random Forest,Prediction,Mse,我试图从消费者支出调查()中预测消费者的总支出。我选择了年龄、收入、城乡、性别、教育等变量来预测一个家庭的总支出 收入和支出之间的相关性相对较小,对于平均值约为10000的数据,预测的RMSE约为3000。我使用转换、标准化、缩放和交叉验证来预处理数据。然而,没有一个模型能够很好地预测总支出。有没有办法改进预测? (我试过线性回归、套索、KNN、随机森林、梯度增强算法) 这是收入和支出的散点图, 我认为该模型表现不佳,因为相关性较小。有什么办法可以解决这种情况吗?这看起来是一个建模问题,而不是

我试图从消费者支出调查()中预测消费者的总支出。我选择了年龄、收入、城乡、性别、教育等变量来预测一个家庭的总支出

收入和支出之间的相关性相对较小,对于平均值约为10000的数据,预测的RMSE约为3000。我使用转换、标准化、缩放和交叉验证来预处理数据。然而,没有一个模型能够很好地预测总支出。有没有办法改进预测? (我试过线性回归、套索、KNN、随机森林、梯度增强算法)

这是收入和支出的散点图,


我认为该模型表现不佳,因为相关性较小。有什么办法可以解决这种情况吗?

这看起来是一个建模问题,而不是编程问题。是的@greybeard你说得对,它看起来不像编程问题。如果我们错了,请尝试详细说明您的问题以获得快速帮助。谢谢@SunilLulla,@greybeard。正如您所说,我在构建模型时面临着一些问题。用相关性较小的数据进行预测有什么想法吗?