Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/67.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 如何为回归/ML组织具有唯一客户ID和年度观察的数据集_R_Data Structures_Predict - Fatal编程技术网

R 如何为回归/ML组织具有唯一客户ID和年度观察的数据集

R 如何为回归/ML组织具有唯一客户ID和年度观察的数据集,r,data-structures,predict,R,Data Structures,Predict,我有一个由房屋销售数据组成的数据集。我想根据各种属性预测给定年份的销售价格(响应变量)。这些房子被分配了唯一的ID,有些在我们的时间范围内被出售了不止一次。为了提高我的预测精度,我希望能够结合任何以前的销售价格和属性来预测未来的房价 我已尝试通过基于客户ID创建行来重新组织数据: 由于每套房子的销售年份不同,这将创建一个包含许多NAs的大型数据集。这使得在执行回归/ML预测房价时变得困难。我最终得到了80%的NAs行,这意味着我必须进行插补才能运行算法,但结果很差 在预测价格时,有没有聪明的

我有一个由房屋销售数据组成的数据集。我想根据各种属性预测给定年份的销售价格(响应变量)。这些房子被分配了唯一的ID,有些在我们的时间范围内被出售了不止一次。为了提高我的预测精度,我希望能够结合任何以前的销售价格和属性来预测未来的房价

我已尝试通过基于客户ID创建行来重新组织数据:

由于每套房子的销售年份不同,这将创建一个包含许多NAs的大型数据集。这使得在执行回归/ML预测房价时变得困难。我最终得到了80%的NAs行,这意味着我必须进行插补才能运行算法,但结果很差

在预测价格时,有没有聪明的方法来实现每套房子的历史销售价格和属性?我曾尝试在训练集和测试集中包含唯一ID(确保训练集和数据集中不会出现相同的ID),但是否有更好的方法来组织数据以获得更好的结果