处理CSV文件并使用Java将其加载到Cassandra中
对于CSV文件,每行是一条记录,格式如下:处理CSV文件并使用Java将其加载到Cassandra中,java,database,csv,cassandra,Java,Database,Csv,Cassandra,对于CSV文件,每行是一条记录,格式如下: 'dataOne1,dataOne2,dataOne3','dataTwo1,dataTwo2','dataThree1,dataThree2,dataThree3,dataThree4' 基本上,引号将数据字符串分成不同的部分(这次是三个部分),在每个部分中,数据被一个逗号分割。有没有一种有效的方法(我们有很多这样的数据行要处理)来解析每一行并获取不同部分的数据以供以后使用?最后,这些数据将进入卡桑德拉数据库。正则表达式?或任何其他建议将不胜感激。
'dataOne1,dataOne2,dataOne3','dataTwo1,dataTwo2','dataThree1,dataThree2,dataThree3,dataThree4'
基本上,引号将数据字符串分成不同的部分(这次是三个部分),在每个部分中,数据被一个逗号分割。有没有一种有效的方法(我们有很多这样的数据行要处理)来解析每一行并获取不同部分的数据以供以后使用?最后,这些数据将进入卡桑德拉数据库。正则表达式?或任何其他建议将不胜感激。我使用的是Java。这个链接提供了Java代码:似乎这个方法适用于小数据集。但是我们公司有大量的csv文件要处理……好的,使用cassandra批量加载程序,这个链接提供JMX实现:pushpalankajaya.blogspot.com/2012/06/bulk-loading-data-to-cassandra-using.html