Java Tess4j api无法准确读取pdf文件
我准备用java中的tess4j阅读pdf文件,它工作得很好,但不幸的是在我的pdf中,所有东西都是表格格式,tess4j正在读取所有行,除了以下两行是货币ZAR和金额4.00,我不知道原因是什么。下表是我缺少的货币和金额行 起息日期(DDMMYY)2014年12月21日 货币南非兰特 数额1.88 银行有限公司 NEDSZAJJ 汇丰银行中介机构Java Tess4j api无法准确读取pdf文件,java,pdf,ocr,tesseract,tess4j,Java,Pdf,Ocr,Tesseract,Tess4j,我准备用java中的tess4j阅读pdf文件,它工作得很好,但不幸的是在我的pdf中,所有东西都是表格格式,tess4j正在读取所有行,除了以下两行是货币ZAR和金额4.00,我不知道原因是什么。下表是我缺少的货币和金额行 起息日期(DDMMYY)2014年12月21日 货币南非兰特 数额1.88 银行有限公司 NEDSZAJJ 汇丰银行中介机构 HSBCBB22 评论意见 你能帮我解决这个问题吗 您可以在此处找到示例PDF。如果您需要任何帮助,您应该共享有问题的PDF(通过一些重要的文件共享
HSBCBB22 评论意见 你能帮我解决这个问题吗
您可以在此处找到示例PDF。如果您需要任何帮助,您应该共享有问题的PDF(通过一些重要的文件共享服务,例如Dropbox或google drive public shares)和您的关键代码。您好,您可以在上面的链接中找到PDF文件