Machine learning h2o深度学习检查点

Machine learning h2o深度学习检查点,machine-learning,neural-network,deep-learning,h2o,checkpointing,Machine Learning,Neural Network,Deep Learning,H2o,Checkpointing,我尝试运行h2o.deeplearning两次,使用checkpoint参数 在2个列车组上(使用相同的参数,不同的时段除外)。 我得到以下错误: 错误:“训练数据的列必须与检查点模型的列相同 即使两个集合具有相同的列。 相关代码如下所示: model <- h2o.deeplearning(x = 2:785, y = 1, training_frame = train1, activation = "RectifierWithDropout

我尝试运行h2o.deeplearning两次,使用checkpoint参数 在2个列车组上(使用相同的参数,不同的时段除外)。 我得到以下错误:

错误:“训练数据的列必须与检查点模型的列相同

即使两个集合具有相同的列。 相关代码如下所示:

model <- h2o.deeplearning(x = 2:785, y = 1, training_frame = train1, 
                      activation = "RectifierWithDropout", 
                      hidden = c(1024,1024,2048),
                      epochs = 10, 
                      l1 = 1e-5, 
                      input_dropout_ratio = 0.2,
                      train_samples_per_iteration = -1, 
                      classification_stop = -1)

model2 <- h2o.deeplearning(x = 2:785, y = 1, training_frame = train2, 
                      checkpoint = model@model_id,
                      activation = "RectifierWithDropout", 
                      hidden = c(1024,1024,2048),
                      epochs = 1000, 
                      l1 = 1e-5, 
                      input_dropout_ratio = 0.2,
                      train_samples_per_iteration = -1, 
                      classification_stop = -1)


> all(colnames(train1)==colnames(train2))
[1] TRUE

> dim(train1)
[1] 54447   785
> dim(train2)
[1] 5553  785
模型尺寸(第1列)
[1] 54447   785
>仪表板集成模块(第2列)
[1] 5553  785
谢谢,
Eli.

这可能是一个过于冗长的检查,它还检查相同的列是否为非常量。尝试禁用
ignore\u const\u cols
以避开此问题


我提交了一份JIRA。

这一问题已在。问题的根源是,
train1
train2
数据帧中有不同的列集合是恒定的(均为零),因此会自动删除不同的列集合。这使得算法认为在检查点模型中使用的训练集和后续训练集中使用了不同的预测集

有关修复程序的更多信息,请参阅。您可以通过从源代码处安装H2O来获得更新,也可以等到下一个夜间版本(可用)