R 当有一个美元符号时,as.H2O失败;无法确定文件类型";

R 当有一个美元符号时,as.H2O失败;无法确定文件类型";,r,h2o,R,H2o,使用h2o包时,我遇到了一个意外错误。在数据集上使用as.h2o时,返回错误无法确定文件类型。经过二进制搜索,我发现了一个有问题的字符:一个美元符号 以下是一个可复制的示例: library(h2o) h2o.init() tmp <- data.frame(text = "$", stringsAsFactors = FALSE) data <- as.h2o(tmp) 你知道如何解决这个问题吗?我想适合Word2Vec模型,所以字符实际上很重要 谢谢 编辑 我一直在调查这件

使用
h2o
包时,我遇到了一个意外错误。在数据集上使用
as.h2o
时,返回错误
无法确定文件类型
。经过二进制搜索,我发现了一个有问题的字符:一个美元符号

以下是一个可复制的示例:

library(h2o)

h2o.init()

tmp <- data.frame(text = "$", stringsAsFactors = FALSE)
data <- as.h2o(tmp)
你知道如何解决这个问题吗?我想适合Word2Vec模型,所以字符实际上很重要

谢谢

编辑

我一直在调查这件事,发现了一些额外的信息。显然,当数据集达到足够大时,问题就不再出现了

我在7000排左右找到了最合适的位置。例如,对于我的数据集:


tmp你好,查尔斯,我设法重现了你的问题,并在H2O的系统中创建了一个JIRA供你跟踪:不幸的是,这是H2O的分布式CSV解析器的错误。数据以CSV格式传递到H2O,CSV解析器无法识别引号中的美元符号($)-它认为这是货币,由于有限状态机中的故障,它最终以无休止的循环运行,直到被ArrayIndexOutOfBounds异常(指针溢出区块数组)停止。你好,Charles,我设法重现了您的问题,并在H2O的系统中创建了一个JIRA供您跟踪:不幸的是,这是H2O的分布式CSV解析器的错误。数据以CSV格式传递到H2O,CSV解析器无法识别引号中的美元符号($)——它认为这是货币,由于有限状态机中的故障,它最终以无休止的循环运行,直到被ArrayIndexOutOfBounds异常(指针溢出区块数组)停止。
ERROR: Unexpected HTTP Status code: 412 Precondition Failed (url = http://localhost:54321/3/ParseSetup)

water.exceptions.H2OIllegalArgumentException
 [1] "water.exceptions.H2OIllegalArgumentException: Cannot determine file type. for /tmp/RtmpseoDZt/file36123d495362.csv_sid_ae2a_2"
 [2] "    water.api.ParseSetupHandler.guessSetup(ParseSetupHandler.java:46)"                                                        
 [3] "    sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)"                                                              
 [4] "    sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)"                                            
 [5] "    sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)"                                    
 [6] "    java.lang.reflect.Method.invoke(Method.java:498)"                                                                         
 [7] "    water.api.Handler.handle(Handler.java:60)"                                                                                
 [8] "    water.api.RequestServer.serve(RequestServer.java:462)"                                                                    
 [9] "    water.api.RequestServer.doGeneric(RequestServer.java:295)"                                                                
[10] "    water.api.RequestServer.doPost(RequestServer.java:221)"                                                                   
[11] "    javax.servlet.http.HttpServlet.service(HttpServlet.java:755)"                                                             
[12] "    javax.servlet.http.HttpServlet.service(HttpServlet.java:848)"                                                             
[13] "    org.eclipse.jetty.servlet.ServletHolder.handle(ServletHolder.java:684)"                                                   
[14] "    org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:501)"                                               
[15] "    org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.java:1086)"                                       
[16] "    org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:427)"                                                
[17] "    org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.java:1020)"                                        
[18] "    org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:135)"                                            
[19] "    org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:154)"                                    
[20] "    org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:116)"                                          
[21] "    water.webserver.jetty8.Jetty8ServerAdapter$LoginHandler.handle(Jetty8ServerAdapter.java:119)"                             
[22] "    org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:154)"                                    
[23] "    org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:116)"                                          
[24] "    org.eclipse.jetty.server.Server.handle(Server.java:370)"                                                                  
[25] "    org.eclipse.jetty.server.AbstractHttpConnection.handleRequest(AbstractHttpConnection.java:494)"                           
[26] "    org.eclipse.jetty.server.BlockingHttpConnection.handleRequest(BlockingHttpConnection.java:53)"                            
[27] "    org.eclipse.jetty.server.AbstractHttpConnection.content(AbstractHttpConnection.java:984)"                                 
[28] "    org.eclipse.jetty.server.AbstractHttpConnection$RequestHandler.content(AbstractHttpConnection.java:1045)"                 
[29] "    org.eclipse.jetty.http.HttpParser.parseNext(HttpParser.java:861)"                                                         
[30] "    org.eclipse.jetty.http.HttpParser.parseAvailable(HttpParser.java:236)"                                                    
[31] "    org.eclipse.jetty.server.BlockingHttpConnection.handle(BlockingHttpConnection.java:72)"                                   
[32] "    org.eclipse.jetty.server.bio.SocketConnector$ConnectorEndPoint.run(SocketConnector.java:264)"                             
[33] "    org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)"                                         
[34] "    org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:543)"                                          
[35] "    java.lang.Thread.run(Thread.java:748)"                                                                                    

Error in .h2o.doSafeREST(h2oRestApiVersion = h2oRestApiVersion, urlSuffix = page,  : 


ERROR MESSAGE:

Cannot determine file type. for /tmp/RtmpseoDZt/file36123d495362.csv_sid_ae2a_2