Java Tess4j api无法准确读取pdf文件

Java Tess4j api无法准确读取pdf文件,java,pdf,ocr,tesseract,tess4j,Java,Pdf,Ocr,Tesseract,Tess4j,我准备用java中的tess4j阅读pdf文件,它工作得很好,但不幸的是在我的pdf中,所有东西都是表格格式,tess4j正在读取所有行,除了以下两行是货币ZAR和金额4.00,我不知道原因是什么。下表是我缺少的货币和金额行 起息日期(DDMMYY)2014年12月21日 货币南非兰特 数额1.88 银行有限公司 NEDSZAJJ 汇丰银行中介机构 HSBCBB22 评论意见 你能帮我解决这个问题吗 您可以在此处找到示例PDF。如果您需要任何帮助,您应该共享有问题的PDF(通过一些重要的文件共享

我准备用java中的tess4j阅读pdf文件,它工作得很好,但不幸的是在我的pdf中,所有东西都是表格格式,tess4j正在读取所有行,除了以下两行是货币ZAR和金额4.00,我不知道原因是什么。下表是我缺少的货币和金额行

起息日期(DDMMYY)2014年12月21日

货币南非兰特

数额1.88

银行有限公司 NEDSZAJJ

汇丰银行中介机构
HSBCBB22

评论意见

你能帮我解决这个问题吗


您可以在此处找到示例PDF。

如果您需要任何帮助,您应该共享有问题的PDF(通过一些重要的文件共享服务,例如Dropbox或google drive public shares)和您的关键代码。您好,您可以在上面的链接中找到PDF文件