Android 获取苔丝二号的单词列表

Android 获取苔丝二号的单词列表,android,tesseract,Android,Tesseract,我正在开发一个应用程序,在Android上使用OCR。tess two示例运行得非常好,我可以获得完整的OCR文本,但我想知道如何获得Tesseract实际输出框中的单个单词。我可以使用getWords().getBoxRects()来获取边界框的列表,getWords()函数似乎做了我想要的事情,但它返回一个Pixa对象,我不确定如何从中获取单词列表(框中包含的任何单词) 我要查找的输出是具有以下键值的映射: 单词:边界框 任何提示都很好。您可以解析hOCR输出以获得单词及其坐标。看 或者使用

我正在开发一个应用程序,在Android上使用OCR。tess two示例运行得非常好,我可以获得完整的OCR文本,但我想知道如何获得Tesseract实际输出框中的单个单词。我可以使用getWords().getBoxRects()来获取边界框的列表,getWords()函数似乎做了我想要的事情,但它返回一个Pixa对象,我不确定如何从中获取单词列表(框中包含的任何单词)

我要查找的输出是具有以下键值的映射:

单词:边界框


任何提示都很好。

您可以解析hOCR输出以获得单词及其坐标。看

或者使用
ResultIterator
API,如果
tesstwo
支持它