Artificial intelligence 推荐人工智能/机器学习:配置文件输入、收入预测

Artificial intelligence 推荐人工智能/机器学习:配置文件输入、收入预测,artificial-intelligence,genetic-algorithm,bayesian-networks,Artificial Intelligence,Genetic Algorithm,Bayesian Networks,我的项目看起来是这样的:我的数据集是一群人的档案,具有各种属性,例如布尔hasJob和int healthScore,以及他们的收入。利用这些数据,我试图预测他们未来的收入。每个档案也有一个历史:例如,他们过去的属性和收入是什么 所以本质上,我试图将多组(x布尔,y数字)映射到一个数字(来年的工资) 我考虑过神经网络、贝叶斯网络和用于函数拟合的遗传算法。有什么建议或意见吗 提前谢谢! --Emily你想做的就是“时间序列建模”。然而,每个系列(每个人)可能只有很少的数据。我认为很难找到一个适合每

我的项目看起来是这样的:我的数据集是一群人的档案,具有各种属性,例如布尔hasJob和int healthScore,以及他们的收入。利用这些数据,我试图预测他们未来的收入。每个档案也有一个历史:例如,他们过去的属性和收入是什么

所以本质上,我试图将多组(x布尔,y数字)映射到一个数字(来年的工资)

我考虑过神经网络、贝叶斯网络和用于函数拟合的遗传算法。有什么建议或意见吗

提前谢谢!
--Emily

你想做的就是“时间序列建模”。然而,每个系列(每个人)可能只有很少的数据。我认为很难找到一个适合每个人的模型,因为你做了一些一般性假设,例如,每个人都同样以职业为导向。此外,这是一个非常吵闹的目标,例如,你必须考虑某人是否是甜言蜜语者。你如何衡量这样一件事?我很确定你当前的属性有足够的噪音,这会让你很难预测任何事情。当你说健康状况时,你是指身体健康还是精神健康。在不同的行业中,不同的事情是重要的。他们所从事的业务或行业如何?它的健康和增长潜力?我认为这对他们的收入影响很大。我还认为,你有因变量以及属性可能(而且很可能)受到目标变量的影响。例如。收入较高的人健康状况较好。这听起来是一件非常复杂和困难的事情,而且“我天真地将数据分组并尝试了一系列方法”绝对不会产生有意义的结果。我建议您学习更多关于时间序列建模的知识,尤其是您拥有的数据。也许可以试着从根据人的初始属性对他们进行聚类开始,看看他们是如何发展的。是否存在与此发展相关的变量

你的研究问题是什么