Python NLP:文档OCR中单词的位置特征

Python NLP:文档OCR中单词的位置特征,python,machine-learning,nlp,ocr,Python,Machine Learning,Nlp,Ocr,我正在尝试将NLP应用于OCR文档。要提取命名实体,如何使用诸如单词在文档中的位置之类的功能 例如,我有一份健康报告,我需要提取报告中某一特定区域的化学术语,并避免它们在其他地方出现。我可以用{top:x,left:y}值来定义此功能的位置特征吗 有学习图书馆吗 您可以构建提取区域来获取此内容。 换句话说,对图像中给定区域内具有所需内容的文档进行分组,然后从该区域获取所有图像的内容。您可以构建提取区域来获取此内容。 换句话说,对图像中给定区域内具有所需内容的文档进行分组,然后从该区域获取所有图像

我正在尝试将NLP应用于OCR文档。要提取命名实体,如何使用诸如单词在文档中的位置之类的功能

例如,我有一份健康报告,我需要提取报告中某一特定区域的化学术语,并避免它们在其他地方出现。我可以用
{top:x,left:y}
值来定义此功能的位置特征吗


有学习图书馆吗

您可以构建提取区域来获取此内容。
换句话说,对图像中给定区域内具有所需内容的文档进行分组,然后从该区域获取所有图像的内容。

您可以构建提取区域来获取此内容。 换句话说,对图像中给定区域内具有所需内容的文档进行分组,然后从该区域获取所有图像的内容