MarkLogic中可填充PDF到XML的转换

MarkLogic中可填充PDF到XML的转换,marklogic,marklogic-9,pdf-conversion,mlcp,Marklogic,Marklogic 9,Pdf Conversion,Mlcp,我已经用MLCP将一些PDF文件加载到MarkLogic中,然后通过CPF默认的PDF转换将其转换为XML。一些PDF是可填充的,但所填充的内容没有一个包含在转换中。有没有一种方法可以改变这一点 这些PDF表单是由用户填写的吗?如果是这样的话,一些转换器就不会携带PDF表单数据。PDFTables可以工作-API允许您将PDF转换为包含任何表单数据的XML 以Python为例(可以使用任何语言): 这些PDF表格是由用户填写的吗?如果是这样的话,一些转换器就不会携带PDF表单数据。PDFTabl

我已经用MLCP将一些PDF文件加载到MarkLogic中,然后通过CPF默认的PDF转换将其转换为XML。一些PDF是可填充的,但所填充的内容没有一个包含在转换中。有没有一种方法可以改变这一点

这些PDF表单是由用户填写的吗?如果是这样的话,一些转换器就不会携带PDF表单数据。PDFTables可以工作-API允许您将PDF转换为包含任何表单数据的XML

以Python为例(可以使用任何语言):


这些PDF表格是由用户填写的吗?如果是这样的话,一些转换器就不会携带PDF表单数据。PDFTables可以工作-API允许您将PDF转换为包含任何表单数据的XML

以Python为例(可以使用任何语言):


是的,它们是由用户填写的PDF表单。是否有任何MarkLogic PDF转换器可以执行此操作,或者是加载到MarkLogic之前转换的唯一选项?我不熟悉MarkLogic,但根据您在初始问题中所说的,我将假设表单数据未结转。是的,它们是由用户填写的PDF表单。是否有任何MarkLogic PDF转换器可以这样做,或者是在加载到MarkLogic之前进行转换的唯一选项?我不熟悉MarkLogic,但根据您在初始问题中所说的,我将假设表单数据没有被带入。
import pdftables_api

c = pdftables_api.Client('my-api-key')

c.xml('input.pdf', 'output.xml')