Ruby AWS Rekognition——如何解析图像中的所有文本?

Ruby AWS Rekognition——如何解析图像中的所有文本?,ruby,amazon-web-services,amazon-rekognition,Ruby,Amazon Web Services,Amazon Rekognition,我试图解析餐馆账单图像中的文本。我已经能够设置ruby AWS SDK,其中Rekognion客户端使用。此外,在本地,我可以打电话给Rekognition,在本地传递图像 当我用#detect_text()调用时,我得到一个响应,该响应具有text detections,表示图像中的行或词。但是,我希望该响应只包含行类型的文本检测。以下是我的问题: 是否有可能获得只包含LINE类型的TextDetections的响应 是否可以增加图像中检测到的单词的限制?显然,根据 DetectText最多可

我试图解析餐馆账单图像中的文本。我已经能够设置ruby AWS SDK,其中Rekognion客户端使用。此外,在本地,我可以打电话给Rekognition,在本地传递图像

当我用
#detect_text
()调用时,我得到一个响应,该响应具有
text detections
,表示图像中的行或词。但是,我希望该响应只包含
行类型的
文本检测。以下是我的问题:

  • 是否有可能获得只包含
    LINE
    类型的
    TextDetections
    的响应
  • 是否可以增加图像中检测到的单词的限制?显然,根据
  • DetectText最多可以检测图像中的50个单词 对我来说,这听起来像是一个很难的限制

  • 有没有一种方法可以让我绕过50个单词的限制?也许我可以对同一个图像进行多次调用,Rekognion可以多次解析同一个图像,直到它拥有所有的单词

  • 对。在图像中检测不到超过50个单词。解决方法是将图像裁剪为多个图像,并在每个裁剪的图像上运行DetectText

    据我所知:不,你不能限制响应,不,你不能增加限制,不,但是多次裁剪和解析是一种常用的方法。您最好使用OCR库而不是Rekognition,因为Rekognition的主要目的是检测对象而不是文本。