java中从PDF中提取阿拉伯语/波斯语文本
我想提取一个包含阿拉伯语和波斯语文本的PDF文档。是否有任何Java API可以将PDF文件中的阿拉伯语或波斯语输出为Java字符串以继续java中从PDF中提取阿拉伯语/波斯语文本,java,pdf,io,converter,Java,Pdf,Io,Converter,我想提取一个包含阿拉伯语和波斯语文本的PDF文档。是否有任何Java API可以将PDF文件中的阿拉伯语或波斯语输出为Java字符串以继续 感谢期待有一些API可以从PDF中提取文本。请看iText或pdfbox。@usr169这更多地取决于PDF本身,而不是图书馆不知道。编写代码。看一看。我试过阿拉伯语和波斯语,但显示了奇怪的字符。这对英语很有用
感谢期待有一些API可以从PDF中提取文本。请看iText或pdfbox。@usr169这更多地取决于PDF本身,而不是图书馆不知道。编写代码。看一看。我试过阿拉伯语和波斯语,但显示了奇怪的字符。这对英语很有用