将XML文件大容量加载到Cassandra中

将XML文件大容量加载到Cassandra中,cassandra,Cassandra,我正在研究使用Cassandra存储5000多万个文档,这些文档目前是XML格式的。我一直在四处寻找,但我似乎找不到任何我可以真正理解的东西,即如何在不需要编写Java的情况下将这些数据批量加载到Cassandra中(在我的语言技能列表中不算高!) 我可以很高兴地编写一个脚本,将这些数据转换成任何格式,如果它能使加载更容易的话,尽管CSV可能很棘手,因为文档的主体可能包含任何内容 欢迎任何建议 谢谢 Si如果您愿意将XML转换为某种分隔格式(即CSV),那么这里有几个选项: 在cqlsh中输入。

我正在研究使用Cassandra存储5000多万个文档,这些文档目前是XML格式的。我一直在四处寻找,但我似乎找不到任何我可以真正理解的东西,即如何在不需要编写Java的情况下将这些数据批量加载到Cassandra中(在我的语言技能列表中不算高!)

我可以很高兴地编写一个脚本,将这些数据转换成任何格式,如果它能使加载更容易的话,尽管CSV可能很棘手,因为文档的主体可能包含任何内容

欢迎任何建议

谢谢


Si

如果您愿意将XML转换为某种分隔格式(即CSV),那么这里有几个选项:

  • cqlsh
    中输入。这在最近版本的《卡桑德拉》中得到了很大的关注
  • 这个。这是一个更加灵活,并有一系列不同的选项,你可以调整取决于文件格式

  • 如果您愿意编写Java以外的代码(例如,Python),那么有很多编程语言。如果您有另一种更擅长的语言,则无需学习Java。

    如果您愿意将XML转换为某种分隔格式(即CSV),那么这里有几个选项:

  • cqlsh
    中输入。这在最近版本的《卡桑德拉》中得到了很大的关注
  • 这个。这是一个更加灵活,并有一系列不同的选项,你可以调整取决于文件格式

  • 如果您愿意编写Java以外的代码(例如,Python),那么有很多编程语言。如果你有另一种更擅长的语言,就不需要学习Java。

    谢谢,我认为cassandra loader会胜任这项工作,我对CSV的关注是XML正文中内容的随机性,但它说我可以使用自定义分隔符,这样应该可以处理问题,如果不行,我可以使用python方法,我会选择C#,但这意味着从linux服务器向windows服务器发送5000多万个文件,因此如果加载程序出现问题,python方法听起来更具吸引力。干杯谢谢我认为cassandra loader会完成这项工作,我对CSV的关注是XML正文中内容的随机性,但它说我可以使用自定义分隔符,这样应该可以处理问题,如果失败,我可以使用python方法,我会选择C#,但这意味着从linux服务器向windows服务器发送5000多万个文件,因此如果加载程序出现问题,python方法听起来更具吸引力。干杯