Java 使用英语和方程训练数据tesseract Tesser4j
我正试图用java中的tess4j读取一幅带有数学方程的图像。然而,我认为它的字符重叠,无法将英语与方程式结合起来。这是一个训练有素的数据问题吗?我怎样才能解决这个问题。下面是我的代码Java 使用英语和方程训练数据tesseract Tesser4j,java,ocr,tesseract,tess4j,Java,Ocr,Tesseract,Tess4j,我正试图用java中的tess4j读取一幅带有数学方程的图像。然而,我认为它的字符重叠,无法将英语与方程式结合起来。这是一个训练有素的数据问题吗?我怎样才能解决这个问题。下面是我的代码 ITesseract tess = new Tesseract(); try { tess.setLanguage("eng+equ"); String imageURL = "http://www.blah.com/images/test-exe
ITesseract tess = new Tesseract();
try {
tess.setLanguage("eng+equ");
String imageURL = "http://www.blah.com/images/test-exercises/exercises.png";
URL url = new URL(imageURL);
BufferedImage img = ImageIO.read(url);
String result = tess.doOCR(img);
System.out.println(result);
} catch (TesseractException e) {
e.printStackTrace();
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
我得到的输出
a) ↥⊝≍⋉↥⋮↥↸⊣⊽≍ k) ↥⋅⊈⋉⇣≁⇃⋅↸≍⋉⇣⋮↸⋅∠⊽≁≍
⊔ ⇃⋅↸
3x ↸≍ ↸ e
7 4:7, ≓ ≓ z, 77
b) 1+ 1 1 1) 3” z») ∙≁−−
↥ ↥ ⋅
r) 17:71:3770 m) ≩∅⊣⇇⋜∅≁↥≻⊣∅≁⊈⋗⋉↖⋮↼↴
3 .
d) ↼↴≍⊣⋜⋮↥↥≍⋉↥∘ n) ⊈⇉≁≍⋮≹⋜⋉⊢⇃⋅∖⊢⊢≩≍≻
9) Liz: o) ⇇⋜↨≍≁⊈⋅↸⋮↥∘⋅−≁⊈⋉↥≟≍
请附上原始图像。用图像编辑问题。代码中提到的url是虚拟的。包含此图像的实际url