Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/clojure/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何构建一个神经网络来提取不同布局的PDF所共有的特定信息?_Python_Pdf - Fatal编程技术网

Python 如何构建一个神经网络来提取不同布局的PDF所共有的特定信息?

Python 如何构建一个神经网络来提取不同布局的PDF所共有的特定信息?,python,pdf,Python,Pdf,我正在从事一个Python项目,我正在尝试构建一个神经网络模型,以提取不同布局的PDF中常见的特定信息。简单地说:目前,我总共有61个PDF表单,其中61个不同的布局都有公共字段“Post Code”。“PostCode”字段框位于不同的页面坐标中,我必须构建并训练一个模型,该模型能够加载任何PDF并提取PostCode字段 我可以构建一个Python模型,它一次只能从一个PDF中提取Post代码,这意味着如果我必须在61个表单上迭代这个过程,这将花费太多的时间。如果PDF都是相同的布局,我就不

我正在从事一个Python项目,我正在尝试构建一个神经网络模型,以提取不同布局的PDF中常见的特定信息。简单地说:目前,我总共有61个PDF表单,其中61个不同的布局都有公共字段“Post Code”。“PostCode”字段框位于不同的页面坐标中,我必须构建并训练一个模型,该模型能够加载任何PDF并提取PostCode字段

我可以构建一个Python模型,它一次只能从一个PDF中提取Post代码,这意味着如果我必须在61个表单上迭代这个过程,这将花费太多的时间。如果PDF都是相同的布局,我就不会有任何问题。当涉及到不同布局的PDF时,我正在努力寻找一种方法来提高流程的效率

从我在Stack Overflow上看到的情况来看,大多数问题都与从一个文档或同一布局的多个文档中提取信息有关。我不想扩展到Python以外的另一种语言,如果有人能找到一种从具有不同布局的PDF中执行特定信息提取的方法,我将不胜感激