用Ruby解析大文件
我需要解析非常大的XML文件(接近50GB),如何使用Ruby来解析?不可能把它分成几块,我已经试过了 我使用用Ruby解析大文件,ruby,parsing,bigdata,Ruby,Parsing,Bigdata,我需要解析非常大的XML文件(接近50GB),如何使用Ruby来解析?不可能把它分成几块,我已经试过了 我使用Nokogiri::XML::Reader解析了一个40GB的文件 我的XML文件的结构: <?xml version="1.0" encoding="utf-8"?> <posts> <row Id="4"> <row Id="5"> </posts> 我认为答案取决于你计划如何使用这些数据。在我的例子中,我只需
Nokogiri::XML::Reader
解析了一个40GB的文件
我的XML文件的结构:
<?xml version="1.0" encoding="utf-8"?>
<posts>
<row Id="4">
<row Id="5">
</posts>
我认为答案取决于你计划如何使用这些数据。在我的例子中,我只需要对post节点进行流式处理 我使用
Nokogiri::XML::Reader
解析了一个40GB的文件
我的XML文件的结构:
<?xml version="1.0" encoding="utf-8"?>
<posts>
<row Id="4">
<row Id="5">
</posts>
我认为答案取决于你计划如何使用这些数据。在我的例子中,我只需要对post节点进行流式处理 你看到这个帖子了吗?我通常使用Nokogiri和流式处理XML。你看到这篇文章了吗?我通常使用Nokogiri并流式传输XML。