R 预测返回NaN?

R 预测返回NaN?,r,prediction,r-caret,R,Prediction,R Caret,我不确定这里要提供什么数据,在不共享我的完整数据的情况下,无法提供复制问题的方法。我只能提供代码和错误信息,希望有人能认识到这一点 我有一个模型,它使用ranger random forrest和一个经过日志转换的目标变量“mod.rangerRF.logknn”。我的新数据有数以万计的记录,但当我预测有一小部分(准确地说是5条)返回时 这仅在模型的日志版本中发生 单次观测预测示例: predict(mod.rangerRF.logknn, newdata = filter(p.test.knn

我不确定这里要提供什么数据,在不共享我的完整数据的情况下,无法提供复制问题的方法。我只能提供代码和错误信息,希望有人能认识到这一点

我有一个模型,它使用ranger random forrest和一个经过日志转换的目标变量“mod.rangerRF.logknn”。我的新数据有数以万计的记录,但当我预测有一小部分(准确地说是5条)返回时

这仅在模型的日志版本中发生

单次观测预测示例:

predict(mod.rangerRF.logknn, newdata = filter(p.test.knn, id == 31874))
[1] 15.40513
返回一个数字,然后我可以对其进行反向转换。除了返回NaN的5条问题记录外,其他所有记录都是这种情况

> predict(mod.rangerRF.logknn, newdata = filter(p.test.knn, id == 31873))
[1] NaN
一个我无法支持的NaN

数万行,数百个特征。运行predict时仅返回5个NaN实例

我不知道从哪里开始调试这个

在预处理过程中,我确保了完整的数据没有丢失值。由于使用了虚拟变量,所有数据都是数字

有人认识到这个问题吗?有没有关于我可以找的地方的指示


根据注释,这里是模型的输出

> print(mod.rangerRF.logknn)
Random Forest 

30471 samples
  193 predictor

No pre-processing
Resampling: Cross-Validated (5 fold) 
Summary of sample sizes: 24376, 24376, 24378, 24377, 24377 
Resampling results across tuning parameters:

  mtry  RMSE       Rsquared 
   2    0.5125155  0.2832599
   5    0.4936741  0.3343648
  10    0.4845437  0.3592030
  20    0.4797720  0.3732469
  40    0.4778534  0.3790508

RMSE was used to select the optimal model using  the smallest value.
The final value used for the model was mtry = 40.

这个问题刚刚在Ranger的github上发布:


希望有帮助。

我们需要查看数据以帮助您。也可能是模型,您可以发布上面添加的
打印输出(mod.rangerRF.logknn)
。如果有任何其他信息我可以提供,请让我知道,因为我使用KNIMPUTE的缺失值,数据已缩放。我想知道这是否是一个因素?