Deployment h2o pojo在测试数据上的列数比模型训练的列数多,有时从训练数据集中缺失列数

Deployment h2o pojo在测试数据上的列数比模型训练的列数多,有时从训练数据集中缺失列数,deployment,pojo,h2o,Deployment,Pojo,H2o,我已经创建了我的POJO模型,在使用Hive UDF生成预测时,我必须以相同的数据类型保持列的顺序?忽略额外列并添加列的最干净方法是什么?这些列存在于列车数据集中,但不存在于测试数据集中。我的所有列都是双列或长列。如果您使用Easy wrapper,它会自动为您执行此操作 如果您没有使用Easy包装器,那么您需要发明相同的行为 使用Easy包装器,新列被忽略,缺少的列被视为N/A

我已经创建了我的POJO模型,在使用Hive UDF生成预测时,我必须以相同的数据类型保持列的顺序?忽略额外列并添加列的最干净方法是什么?这些列存在于列车数据集中,但不存在于测试数据集中。我的所有列都是双列或长列。

如果您使用Easy wrapper,它会自动为您执行此操作

如果您没有使用Easy包装器,那么您需要发明相同的行为

使用Easy包装器,新列被忽略,缺少的列被视为N/A