Android 获取苔丝二号的单词列表
我正在开发一个应用程序,在Android上使用OCR。tess two示例运行得非常好,我可以获得完整的OCR文本,但我想知道如何获得Tesseract实际输出框中的单个单词。我可以使用getWords().getBoxRects()来获取边界框的列表,getWords()函数似乎做了我想要的事情,但它返回一个Pixa对象,我不确定如何从中获取单词列表(框中包含的任何单词) 我要查找的输出是具有以下键值的映射: 单词:边界框Android 获取苔丝二号的单词列表,android,tesseract,Android,Tesseract,我正在开发一个应用程序,在Android上使用OCR。tess two示例运行得非常好,我可以获得完整的OCR文本,但我想知道如何获得Tesseract实际输出框中的单个单词。我可以使用getWords().getBoxRects()来获取边界框的列表,getWords()函数似乎做了我想要的事情,但它返回一个Pixa对象,我不确定如何从中获取单词列表(框中包含的任何单词) 我要查找的输出是具有以下键值的映射: 单词:边界框 任何提示都很好。您可以解析hOCR输出以获得单词及其坐标。看 或者使用
任何提示都很好。您可以解析hOCR输出以获得单词及其坐标。看 或者使用
ResultIterator
API,如果tesstwo
支持它