R h2o.ai/h2o.automl:分类变量超出范围
我正在使用h2o.automl来构建模型 当尝试使用根据测试数据训练的模型预测结果时,我得到以下错误:R h2o.ai/h2o.automl:分类变量超出范围,r,h2o,R,H2o,我正在使用h2o.automl来构建模型 当尝试使用根据测试数据训练的模型预测结果时,我得到以下错误: Error: DistributedException from localhost/127.0.0.1:54321: 'Categorical value out of bounds, got 15, next cat starts at 40', caused by java.lang.AssertionError: Categorical value out of bounds, got
Error: DistributedException from localhost/127.0.0.1:54321:
'Categorical value out of bounds, got 15, next cat starts at 40',
caused by java.lang.AssertionError: Categorical value out of bounds,
got 15, next cat starts at 40
我如何找出这与什么变量有关?h2o.ai真让我抓狂,使用AutoML,predict总是有
,原因是:java.lang.ArrayIndexOutOfBoundsException:Index-22超出长度630的范围错误。
使用train.csv
进行培训,使用train.csv
进行预测是可以的,使用predict.csv
进行预测总是错误的!
train.csv
和predict.csv
具有相同的标题和顺序。h2o.ai真是让我抓狂,使用AutoML,predict总是具有,原因是:java.lang.arrayindexoutofbounds异常:长度630的索引-22超出范围
错误。
使用train.csv
进行培训,使用train.csv
进行预测是可以的,使用predict.csv
进行预测总是错误的!
train.csv
和predict.csv
具有相同的标题和顺序。感谢您的报告,您能提供一个可复制的示例吗?我知道你不能托管kaggle数据集,所以它不能完全“复制粘贴”复制,但如果你能提供你使用的代码,那会很有帮助。谢谢你跳出来,@ErinLeDell。我希望这能有所帮助:看起来这是h2o的一个已知问题:。是的,这是一个带有堆叠集成函数的bug。。。将很快得到修复。即使使用选项exclude\u algos=c(“StackedAssemble”)
,我也会遇到类似的错误。删除高基数分类功能很有帮助。感谢您的报告,您能提供一个可复制的示例吗?我知道你不能托管kaggle数据集,所以它不能完全“复制粘贴”复制,但如果你能提供你使用的代码,那会很有帮助。谢谢你跳出来,@ErinLeDell。我希望这能有所帮助:看起来这是h2o的一个已知问题:。是的,这是一个带有堆叠集成函数的bug。。。将很快得到修复。即使使用选项exclude\u algos=c(“StackedAssemble”)
,我也会遇到类似的错误。删除高基数分类功能会有所帮助。