Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/haskell/8.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用Java将RTF转换为XML_Java_Xml_Etl_Rtf_Data Transform - Fatal编程技术网

使用Java将RTF转换为XML

使用Java将RTF转换为XML,java,xml,etl,rtf,data-transform,Java,Xml,Etl,Rtf,Data Transform,我有一个富文本文档(.rtf或.doc),其中有许多数据元素需要读取并转换为结构化数据对象(XML或Json)。这些文档在数据方面有一定的格式。有没有我可以使用java转换的库。有没有人遇到过这种情况 有人尝试过ApachePOI或ApacheTika转换成XML吗?我将把这个任务分成两个解析器和两个序列化器 将rtf解析为java模型 将文档解析为java模型 将java模型序列化为xml 将java模型序列化为json 对于1和2来说,使用它是相当标准的。 对于3和4,您有更多的选择,一个流

我有一个富文本文档(.rtf或.doc),其中有许多数据元素需要读取并转换为结构化数据对象(XML或Json)。这些文档在数据方面有一定的格式。有没有我可以使用java转换的库。有没有人遇到过这种情况


有人尝试过ApachePOI或ApacheTika转换成XML吗?我将把这个任务分成两个解析器和两个序列化器

  • 将rtf解析为java模型
  • 将文档解析为java模型
  • 将java模型序列化为xml
  • 将java模型序列化为json
  • 对于1和2来说,使用它是相当标准的。
    对于3和4,您有更多的选择,一个流行的选择是

    我建议您看看哪些可以用来填充适合进一步处理或持久化的Java数据结构。

    为什么不先找到合适的工具,然后找出如何调用它呢?因为这听起来100%像Hi-Mike的工作,所以我们需要以系统的方式将其作为批处理工作的一部分。因此,我们必须选择一种编程技术——java、perl、shell等等——如果您需要将其作为一个自动化步骤,那么用java进行转换有点疯狂。在shell脚本中调用pandoc会更有意义,然后让相同的shell脚本运行您编写的任何java程序来进一步处理XML(如果您需要,因为您也可以使用独立的XLST转换器,如saxon等),非常感谢。让我尝试使用POI将文档解析为java。同意一旦我们有了Java模型,就很容易转换成xml/json。我确实尝试过使用POI,但所有这些都转换成字符串,看起来我们可能需要将字符串转换成结构化Java对象。你知道怎样才能做到吗?