用于XML文件的非常简单的命令行SAX解析器

用于XML文件的非常简单的命令行SAX解析器,xml,command-line,sax,Xml,Command Line,Sax,我以前使用过XMLET来处理XML文件。您可以给它一个简单的comannd行,它将(在内部)生成一个XSLT模板并将其应用于XML文件 但是现在我有了一个大的XML文件,所以我真的需要使用SAX,而不是XSLT。与其编写一个简单的程序来实现这一点,我想知道是否有更简单的方法,从命令行获得一个真正简单的SAX解析器。您可以给它一些选项,它将沿着您的XML文件快速移动,并从中打印出一些结构化数据。下载Python并以交互式命令行模式运行它 文件 例如: 不确定要提取什么以及如何提取(因为使用sax

我以前使用过XMLET来处理XML文件。您可以给它一个简单的comannd行,它将(在内部)生成一个XSLT模板并将其应用于XML文件


但是现在我有了一个大的XML文件,所以我真的需要使用SAX,而不是XSLT。与其编写一个简单的程序来实现这一点,我想知道是否有更简单的方法,从命令行获得一个真正简单的SAX解析器。您可以给它一些选项,它将沿着您的XML文件快速移动,并从中打印出一些结构化数据。

下载Python并以交互式命令行模式运行它

文件

例如:

不确定要提取什么以及如何提取(因为使用sax,您需要自己完成所有工作),因此“配置”非常复杂,因此没有命令行工具,只有允许您执行sax的编程语言


您的xml有多大?可能会有帮助(也取决于xml的大小。

同样,我有1.1G xml文件

使用xsltproc会占用6G内存,但是完成了

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
我也尝试了saxon,但它的内存不足,失败了

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

最后,我们听从了丹格伦的建议,使用了Python,ATM。

链接已断开,但它的快照仍然可用,如果没有足够的文档:,