Ruby on rails CSV加载程序错误

Ruby on rails CSV加载程序错误,ruby-on-rails,ruby-on-rails-3.2,data-mining,weka,Ruby On Rails,Ruby On Rails 3.2,Data Mining,Weka,我正在尝试上载CSV文件,但出现以下错误: weka csv loader failed to load csv file Wrong number of values. Read 2, expected 5, read token[EOL], line 3 这是我的数据示例: 1439,"@shanli4m sagen wirs so ich bin fuer ALLE andern AUSSER SPANIEN hahahhaah :-)",219886226486992900,"2012

我正在尝试上载CSV文件,但出现以下错误:

weka csv loader failed to load csv file
Wrong number of values. Read 2, expected 5, read token[EOL], line 3
这是我的数据示例:

1439,"@shanli4m sagen wirs so ich bin fuer ALLE andern AUSSER SPANIEN hahahhaah :-)",219886226486992900,"2012-07-08 08:17:40.079310","2012-07-08 08:17:40.141548"
1440,"ich bin für schland=schland verliert ich bin für italien=italien verliert verkehrte welt -,-",219727870568824830,"2012-07-08 08:17:40.145610","2012-07-08 08:17:40.148478" 
1441,"RT @orbisclaudiae: ""Ich bin für Spanien, weil ich finde, dass die besser aussehen."" (Claudia H., 29, Fußballexpertin)",219544383773618180,"2012-07-08 08:17:40.151433","2012-07-08 08:17:40.153887" 

我认为这是由于第三行的一个问题:

"RT @orbisclaudiae: ""Ich bin für Spanien

正如您在“Ich”之前看到的,有两个双引号。这将关闭第一部分(
“RT@orbiscaudiae:”
),Weka需要逗号(
)或行尾。因为它后面没有逗号,所以Weka假定该行已结束,然后返回的值只有2个,而不是5个。所以要解决这个问题,请检查数据是否存在任何不一致之处,比如多个双引号。您可以通过在tweet周围加上单引号(
)来轻松解决这个问题。Weka很有可能把单个引文中的每一个都看作是1串。< /P>我猜它有5个字段的CSV,只找到2个……你能提供你的CSV文件的前5行吗?1439,“@ ShanLi4m Saig-WiRs,所以ICH Bin Fuler-ALE and Adern Assier-ShanihanHaaHaHa::”),“2012-0708 08:17:40.079310”,“2012-07-08:17:40.141548”1440,“ich bin für schland=schland Verlier ich bin für italien=italien Verlier verkehrte welt-,-”,219727870568824830,“2012-07-08:17:40.145610”,“2012-07-08:17:40.148478”1441,“RT@Orbiscaudiae:“ich bin für Spanien,weil ich finde,dass die besser aussehen Claudia H.,29,Fuß芭蕾舞团。”“,219544383773618180,“2012-07-08 08:17:40.151433”,“2012-07-08 08:17:40.153887”这些是我存储在数据库中的Twitter推文。我编辑了你的帖子以使其更清晰。下次,如果您有与您的问题相关的新信息,您可能希望自己编辑您的帖子,而不是在评论中添加数据。问题确实在这里,因为csv解析器的一些实现通过将引号字符加倍来转义引号字符,而weka csv解析器似乎没有。