Python 如何构建一个神经网络来提取不同布局的PDF所共有的特定信息？_Python_Pdf

Python 如何构建一个神经网络来提取不同布局的PDF所共有的特定信息？

python pdf

Python 如何构建一个神经网络来提取不同布局的PDF所共有的特定信息？,python,pdf,Python,Pdf,我正在从事一个Python项目，我正在尝试构建一个神经网络模型，以提取不同布局的PDF中常见的特定信息。简单地说：目前，我总共有61个PDF表单，其中61个不同的布局都有公共字段“Post Code”。“PostCode”字段框位于不同的页面坐标中，我必须构建并训练一个模型，该模型能够加载任何PDF并提取PostCode字段我可以构建一个Python模型，它一次只能从一个PDF中提取Post代码，这意味着如果我必须在61个表单上迭代这个过程，这将花费太多的时间。如果PDF都是相同的布局，我就不

我正在从事一个Python项目，我正在尝试构建一个神经网络模型，以提取不同布局的PDF中常见的特定信息。简单地说：目前，我总共有61个PDF表单，其中61个不同的布局都有公共字段“Post Code”。“PostCode”字段框位于不同的页面坐标中，我必须构建并训练一个模型，该模型能够加载任何PDF并提取PostCode字段

我可以构建一个Python模型，它一次只能从一个PDF中提取Post代码，这意味着如果我必须在61个表单上迭代这个过程，这将花费太多的时间。如果PDF都是相同的布局，我就不会有任何问题。当涉及到不同布局的PDF时，我正在努力寻找一种方法来提高流程的效率

从我在Stack Overflow上看到的情况来看，大多数问题都与从一个文档或同一布局的多个文档中提取信息有关。我不想扩展到Python以外的另一种语言，如果有人能找到一种从具有不同布局的PDF中执行特定信息提取的方法，我将不胜感激