Computer vision Microsoft计算机视觉OCR-将来自不同地区的线拼接在一起_Computer Vision_Ocr_Text Extraction

Computer vision Microsoft计算机视觉OCR-将来自不同地区的线拼接在一起

computer-vision

Computer vision Microsoft计算机视觉OCR-将来自不同地区的线拼接在一起,computer-vision,ocr,text-extraction,Computer Vision,Ocr,Text Extraction,我正在尝试使用微软的计算机视觉OCR API从图像上的表格中获取信息。我遇到的问题是，返回的数据通常有各种各样的qwerky区域，我正试图将所有区域拼凑在一起，以获得完整的可读和可解析文本行我认为唯一有意义的方法是使用方向旋转边界框坐标，并检查哪些“线”在另一个给定边界框高度的给定百分比范围内-可能是20%左右这是我到目前为止唯一想到的方法，我开始觉得我把事情复杂化了；有没有一种标准的方法可以让人们建立OCR区域来获取可读文本？没有这样的标准方法。然而，人们会根据需要选择正则表达式。 Azu

我正在尝试使用微软的计算机视觉OCR API从图像上的表格中获取信息。我遇到的问题是，返回的数据通常有各种各样的qwerky区域，我正试图将所有区域拼凑在一起，以获得完整的可读和可解析文本行

我认为唯一有意义的方法是使用方向旋转边界框坐标，并检查哪些“线”在另一个给定边界框高度的给定百分比范围内-可能是20%左右

这是我到目前为止唯一想到的方法，我开始觉得我把事情复杂化了；有没有一种标准的方法可以让人们建立OCR区域来获取可读文本？

没有这样的标准方法。然而，人们会根据需要选择正则表达式。 Azure OCR以单词及其边界框的形式返回JSON响应。从那时起，由你来解释结果。ocr API对此任务没有帮助

首先，正则表达式是解析文本数据的好方法。或者尝试reddit帖子中描述的机器学习方法：