Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/xslt/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Xml 是否可以从PDF生成XSL-FO模板?_Xml_Xslt_Code Generation_Apache Fop - Fatal编程技术网

Xml 是否可以从PDF生成XSL-FO模板?

Xml 是否可以从PDF生成XSL-FO模板?,xml,xslt,code-generation,apache-fop,Xml,Xslt,Code Generation,Apache Fop,给定一个PDF文档,是否可以生成XSL-FO(FOP)模板 显然,这是一件一次性的事情——生成的模板将只是创建一个适当的模板的起点,该模板可以提取适当的数据 对我来说,这样做的理想工具是基于Java的工具,应该可以从命令行或通过ANT任务执行。如果做不到这一点,它将运行在Linux和MacOS X上。我不知道有这样的工具。没有文档结构信息的PDF(带标签的PDF)很像扫描的页面。没有语义。你甚至不能确定你能猜出段落开始或结束的正确位置。如果您已经标记了PDF,那么根据文档结构中的详细程度,您可能

给定一个PDF文档,是否可以生成XSL-FO(FOP)模板

显然,这是一件一次性的事情——生成的模板将只是创建一个适当的模板的起点,该模板可以提取适当的数据


对我来说,这样做的理想工具是基于Java的工具,应该可以从命令行或通过ANT任务执行。如果做不到这一点,它将运行在Linux和MacOS X上。

我不知道有这样的工具。没有文档结构信息的PDF(带标签的PDF)很像扫描的页面。没有语义。你甚至不能确定你能猜出段落开始或结束的正确位置。如果您已经标记了PDF,那么根据文档结构中的详细程度,您可能会获得更多信息。但我敢肯定你永远不会得到一个令人满意的结果。在我看来,您学习XSLT和手工重新创建文档模板(即样式表)的速度要快得多。这将使您获得良好的代码可读性、更好的语义以及更好的机会在类似文档类型之间分解出公共元素