加载级别/类别过多的数据时出错h2o.importFile()
我正在尝试使用R中的h2o.importfile导入一个大的.csv文件加载级别/类别过多的数据时出错h2o.importFile(),r,h2o,R,H2o,我正在尝试使用R中的h2o.importfile导入一个大的.csv文件 library(h2o) h2o.init() dataFile <- "big_file.csv" h2o.importFile(dataFile,header=TRUE,destination_frame = "data.hex") 该文件有许多id列。我收到以下错误消息 错误:water.parser.ParseDataset$H2OParseException:超出了列[id1,id2]的分类限制。考虑将
library(h2o)
h2o.init()
dataFile <- "big_file.csv"
h2o.importFile(dataFile,header=TRUE,destination_frame = "data.hex")
该文件有许多id列。我收到以下错误消息
错误:water.parser.ParseDataset$H2OParseException:超出了列[id1,id2]的分类限制。考虑将这些列作为字符串重新解析。
有没有办法将这些列类型指定为类似于data.framestringAsFactors=FALSE的字符串?在h2o.importFile函数中指定col.types参数应该对您有用
write.csv(iris, "iris.csv")
hf0 <- h2o.importFile("iris.csv", col.types = c("int","real","real","real","real","string"))
unlist(h2o.getTypes(hf0))
[1] "int" "real" "real" "real" "real" "string"