Computer vision Microsoft计算机视觉OCR-将来自不同地区的线拼接在一起

Computer vision Microsoft计算机视觉OCR-将来自不同地区的线拼接在一起,computer-vision,ocr,text-extraction,Computer Vision,Ocr,Text Extraction,我正在尝试使用微软的计算机视觉OCR API从图像上的表格中获取信息。我遇到的问题是,返回的数据通常有各种各样的qwerky区域,我正试图将所有区域拼凑在一起,以获得完整的可读和可解析文本行 我认为唯一有意义的方法是使用方向旋转边界框坐标,并检查哪些“线”在另一个给定边界框高度的给定百分比范围内-可能是20%左右 这是我到目前为止唯一想到的方法,我开始觉得我把事情复杂化了;有没有一种标准的方法可以让人们建立OCR区域来获取可读文本?没有这样的标准方法。然而,人们会根据需要选择正则表达式。 Azu

我正在尝试使用微软的计算机视觉OCR API从图像上的表格中获取信息。我遇到的问题是,返回的数据通常有各种各样的qwerky区域,我正试图将所有区域拼凑在一起,以获得完整的可读和可解析文本行

我认为唯一有意义的方法是使用方向旋转边界框坐标,并检查哪些“线”在另一个给定边界框高度的给定百分比范围内-可能是20%左右


这是我到目前为止唯一想到的方法,我开始觉得我把事情复杂化了;有没有一种标准的方法可以让人们建立OCR区域来获取可读文本?

没有这样的标准方法。然而,人们会根据需要选择正则表达式。 Azure OCR以单词及其边界框的形式返回JSON响应。从那时起,由你来解释结果。ocr API对此任务没有帮助

首先,正则表达式是解析文本数据的好方法。或者尝试reddit帖子中描述的机器学习方法: