Java 在GB';s、 保留页眉和页脚-相同的结构
我的程序将接收大小高达8GB到10GB的XML,其结构如下:Java 在GB';s、 保留页眉和页脚-相同的结构,java,xml,parsing,split,Java,Xml,Parsing,Split,我的程序将接收大小高达8GB到10GB的XML,其结构如下: <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE gsafeed PUBLIC "-//Google//DTD GSA Feeds//EN" ""> <gsafeed> <header> <datasource>Name</datasource> <feedtype>incremental</fee
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE gsafeed PUBLIC "-//Google//DTD GSA Feeds//EN" "">
<gsafeed>
<header>
<datasource>Name</datasource>
<feedtype>incremental</feedtype>
</header>
<group>
<record url="" action="add" mimetype="text/html" >
<content><![CDATA[ <html> <body><<br></body></html> ]]>
</content>
</record>
<record url="" action="add" mimetype="text/html" >
<content><![CDATA[ <html> <body><<br></body></html> ]]>
</content>
</record>
<record url="" action="add" mimetype="text/html" >
<content><![CDATA[ <html> <body><<br></body></html> ]]>
</content>
</record>
</group>
</gsafeed>
名称
增量的
现在,我必须将这个XML文件按1 GB(大约)进行拆分,保留相同的结构,即每个拆分的文件都应该有相同的页眉和页脚,只是
节点的数量会更少
我必须在JDK1.4中这样做
请建议
谢谢你事先知道页脚吗?如果是这样,您只需要一个流式API,比如SAX或SAX-StAX,这可能比SAX容易得多,但它没有内置到Java1.4中,因此您需要一个额外的依赖项 基本上你需要这样做:
@vtd xml作者那里没有例子,你的文档很差