R 当有一个美元符号时,as.H2O失败;无法确定文件类型";
使用R 当有一个美元符号时,as.H2O失败;无法确定文件类型";,r,h2o,R,H2o,使用h2o包时,我遇到了一个意外错误。在数据集上使用as.h2o时,返回错误无法确定文件类型。经过二进制搜索,我发现了一个有问题的字符:一个美元符号 以下是一个可复制的示例: library(h2o) h2o.init() tmp <- data.frame(text = "$", stringsAsFactors = FALSE) data <- as.h2o(tmp) 你知道如何解决这个问题吗?我想适合Word2Vec模型,所以字符实际上很重要 谢谢 编辑 我一直在调查这件
h2o
包时,我遇到了一个意外错误。在数据集上使用as.h2o
时,返回错误无法确定文件类型
。经过二进制搜索,我发现了一个有问题的字符:一个美元符号
以下是一个可复制的示例:
library(h2o)
h2o.init()
tmp <- data.frame(text = "$", stringsAsFactors = FALSE)
data <- as.h2o(tmp)
你知道如何解决这个问题吗?我想适合Word2Vec模型,所以字符实际上很重要
谢谢
编辑
我一直在调查这件事,发现了一些额外的信息。显然,当数据集达到足够大时,问题就不再出现了
我在7000排左右找到了最合适的位置。例如,对于我的数据集:
tmp你好,查尔斯,我设法重现了你的问题,并在H2O的系统中创建了一个JIRA供你跟踪:不幸的是,这是H2O的分布式CSV解析器的错误。数据以CSV格式传递到H2O,CSV解析器无法识别引号中的美元符号($)-它认为这是货币,由于有限状态机中的故障,它最终以无休止的循环运行,直到被ArrayIndexOutOfBounds异常(指针溢出区块数组)停止。你好,Charles,我设法重现了您的问题,并在H2O的系统中创建了一个JIRA供您跟踪:不幸的是,这是H2O的分布式CSV解析器的错误。数据以CSV格式传递到H2O,CSV解析器无法识别引号中的美元符号($)——它认为这是货币,由于有限状态机中的故障,它最终以无休止的循环运行,直到被ArrayIndexOutOfBounds异常(指针溢出区块数组)停止。
ERROR: Unexpected HTTP Status code: 412 Precondition Failed (url = http://localhost:54321/3/ParseSetup)
water.exceptions.H2OIllegalArgumentException
[1] "water.exceptions.H2OIllegalArgumentException: Cannot determine file type. for /tmp/RtmpseoDZt/file36123d495362.csv_sid_ae2a_2"
[2] " water.api.ParseSetupHandler.guessSetup(ParseSetupHandler.java:46)"
[3] " sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)"
[4] " sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)"
[5] " sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)"
[6] " java.lang.reflect.Method.invoke(Method.java:498)"
[7] " water.api.Handler.handle(Handler.java:60)"
[8] " water.api.RequestServer.serve(RequestServer.java:462)"
[9] " water.api.RequestServer.doGeneric(RequestServer.java:295)"
[10] " water.api.RequestServer.doPost(RequestServer.java:221)"
[11] " javax.servlet.http.HttpServlet.service(HttpServlet.java:755)"
[12] " javax.servlet.http.HttpServlet.service(HttpServlet.java:848)"
[13] " org.eclipse.jetty.servlet.ServletHolder.handle(ServletHolder.java:684)"
[14] " org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:501)"
[15] " org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.java:1086)"
[16] " org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:427)"
[17] " org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.java:1020)"
[18] " org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:135)"
[19] " org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:154)"
[20] " org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:116)"
[21] " water.webserver.jetty8.Jetty8ServerAdapter$LoginHandler.handle(Jetty8ServerAdapter.java:119)"
[22] " org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:154)"
[23] " org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:116)"
[24] " org.eclipse.jetty.server.Server.handle(Server.java:370)"
[25] " org.eclipse.jetty.server.AbstractHttpConnection.handleRequest(AbstractHttpConnection.java:494)"
[26] " org.eclipse.jetty.server.BlockingHttpConnection.handleRequest(BlockingHttpConnection.java:53)"
[27] " org.eclipse.jetty.server.AbstractHttpConnection.content(AbstractHttpConnection.java:984)"
[28] " org.eclipse.jetty.server.AbstractHttpConnection$RequestHandler.content(AbstractHttpConnection.java:1045)"
[29] " org.eclipse.jetty.http.HttpParser.parseNext(HttpParser.java:861)"
[30] " org.eclipse.jetty.http.HttpParser.parseAvailable(HttpParser.java:236)"
[31] " org.eclipse.jetty.server.BlockingHttpConnection.handle(BlockingHttpConnection.java:72)"
[32] " org.eclipse.jetty.server.bio.SocketConnector$ConnectorEndPoint.run(SocketConnector.java:264)"
[33] " org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)"
[34] " org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:543)"
[35] " java.lang.Thread.run(Thread.java:748)"
Error in .h2o.doSafeREST(h2oRestApiVersion = h2oRestApiVersion, urlSuffix = page, :
ERROR MESSAGE:
Cannot determine file type. for /tmp/RtmpseoDZt/file36123d495362.csv_sid_ae2a_2