在JavaCpp Tessearact中获取单词级边界框_Java_Ocr_Tesseract_Bounding Box_Javacpp

在JavaCpp Tessearact中获取单词级边界框

java

在JavaCpp Tessearact中获取单词级边界框,java,ocr,tesseract,bounding-box,javacpp,Java,Ocr,Tesseract,Bounding Box,Javacpp,我试图从javacpp tesseract中提取每个单词的边界框。这似乎是边界框调用（下面是我的完整代码）： RIL_WORD是迭代器级别，可以针对单词、句子和段落进行调整。坐标是intpointer（包含javacpp类） api表示这将返回边界框坐标，但会返回布尔值。所以在这一点上，我知道有一个边界框，但仍然不能得到实际的坐标。有人知道如何从java cpp tessaract中获取边界框矩形吗？谢谢你的帮助。我已经发布了我的工作代码，以获取下面的单个单词和置信水平，因为我很难找到示例 pu

我试图从javacpp tesseract中提取每个单词的边界框。这似乎是边界框调用（下面是我的完整代码）：

RIL_WORD是迭代器级别，可以针对单词、句子和段落进行调整。坐标是intpointer（包含javacpp类）

api表示这将返回边界框坐标，但会返回布尔值。所以在这一点上，我知道有一个边界框，但仍然不能得到实际的坐标。有人知道如何从java cpp tessaract中获取边界框矩形吗？谢谢你的帮助。我已经发布了我的工作代码，以获取下面的单个单词和置信水平，因为我很难找到示例

public class TesseractOCR {
    public void OCRText() {
        BytePointer outText;

        TessBaseAPI api = new TessBaseAPI();
        // Initialize tesseract-ocr with English, without specifying tessdata path

    if (api.Init(null, "eng") != 0) {
        System.err.println("Could not initialize tesseract.");
        System.exit(1);
    }

    // Open input image with leptonica library

    org.bytedeco.javacpp.lept.PIX image = pixRead("testimage.png");


    // Get OCR result
    outText = api.GetUTF8Text();
    System.out.println("OCR output:\n" + outText.getString());


    final ResultIterator ri = api.GetIterator();

    int x1 = 0;
    int y1 = 0;
    int x2 = 0;
    int y2 = 0;

    IntPointer coord1 = new IntPointer(x1);
    IntPointer coord2 = new IntPointer(y1);
    IntPointer coord3 = new IntPointer(x2);
    IntPointer coord4 = new IntPointer(y2);

    ri.Begin();

    if (ri !=null) {

        do {
            BytePointer word = ri.GetUTF8Text(RIL_WORD);
            float conf  = ri.Confidence(RIL_WORD);
            boolean box = ri.BoundingBox(RIL_WORD, coord1, coord2, coord3, coord4);

            System.out.println(word.getString());
            System.out.println(conf);
            System.out.println(box);


        } while (ri.Next(RIL_WORD));

    }



    api.End();
    outText.deallocate();
    pixDestroy(image);
    }
}

我明白了。这将打印出坐标：System.out.println（coord1.get（））；

public class TesseractOCR {
    public void OCRText() {
        BytePointer outText;

        TessBaseAPI api = new TessBaseAPI();
        // Initialize tesseract-ocr with English, without specifying tessdata path

    if (api.Init(null, "eng") != 0) {
        System.err.println("Could not initialize tesseract.");
        System.exit(1);
    }

    // Open input image with leptonica library

    org.bytedeco.javacpp.lept.PIX image = pixRead("testimage.png");


    // Get OCR result
    outText = api.GetUTF8Text();
    System.out.println("OCR output:\n" + outText.getString());


    final ResultIterator ri = api.GetIterator();

    int x1 = 0;
    int y1 = 0;
    int x2 = 0;
    int y2 = 0;

    IntPointer coord1 = new IntPointer(x1);
    IntPointer coord2 = new IntPointer(y1);
    IntPointer coord3 = new IntPointer(x2);
    IntPointer coord4 = new IntPointer(y2);

    ri.Begin();

    if (ri !=null) {

        do {
            BytePointer word = ri.GetUTF8Text(RIL_WORD);
            float conf  = ri.Confidence(RIL_WORD);
            boolean box = ri.BoundingBox(RIL_WORD, coord1, coord2, coord3, coord4);

            System.out.println(word.getString());
            System.out.println(conf);
            System.out.println(box);


        } while (ri.Next(RIL_WORD));

    }



    api.End();
    outText.deallocate();
    pixDestroy(image);
    }
}