用Ruby解析大文件

用Ruby解析大文件,ruby,parsing,bigdata,Ruby,Parsing,Bigdata,我需要解析非常大的XML文件(接近50GB),如何使用Ruby来解析?不可能把它分成几块,我已经试过了 我使用Nokogiri::XML::Reader解析了一个40GB的文件 我的XML文件的结构: <?xml version="1.0" encoding="utf-8"?> <posts> <row Id="4"> <row Id="5"> </posts> 我认为答案取决于你计划如何使用这些数据。在我的例子中,我只需

我需要解析非常大的XML文件(接近50GB),如何使用Ruby来解析?不可能把它分成几块,我已经试过了

我使用
Nokogiri::XML::Reader
解析了一个40GB的文件

我的XML文件的结构:

<?xml version="1.0" encoding="utf-8"?>
<posts>
   <row Id="4">
   <row Id="5">
</posts>

我认为答案取决于你计划如何使用这些数据。在我的例子中,我只需要对post节点进行流式处理

我使用
Nokogiri::XML::Reader
解析了一个40GB的文件

我的XML文件的结构:

<?xml version="1.0" encoding="utf-8"?>
<posts>
   <row Id="4">
   <row Id="5">
</posts>
我认为答案取决于你计划如何使用这些数据。在我的例子中,我只需要对post节点进行流式处理

你看到这个帖子了吗?我通常使用Nokogiri和流式处理XML。你看到这篇文章了吗?我通常使用Nokogiri并流式传输XML。