iText java-是否可以更改pdf中的toUnicode映射?

iText java-是否可以更改pdf中的toUnicode映射?,java,itext,Java,Itext,是否可以更改pdf文件中的toUnicode映射,以便itext可以正确提取文本?要提取文本,您不能使用pdftextractor?@JAVY:pdf具有某些特殊字符,如alpha、beta等。。。当我使用PDFTextractor时,这些字符没有正确提取。例如,β变为P2。有没有办法解决这个问题?看一看(这个问题是针对汉字的,但可能对你有帮助)首先,一般来说,PDF中没有“toUnicode映射”,每个页面上的每个字体都可能有自己的字体。也就是说,是的,您可以更改这些映射。但是“β变为P2”听

是否可以更改pdf文件中的toUnicode映射,以便itext可以正确提取文本?

要提取文本,您不能使用
pdftextractor
?@JAVY:pdf具有某些特殊字符,如alpha、beta等。。。当我使用PDFTextractor时,这些字符没有正确提取。例如,β变为P2。有没有办法解决这个问题?看一看(这个问题是针对汉字的,但可能对你有帮助)首先,一般来说,PDF中没有“toUnicode映射”,每个页面上的每个字体都可能有自己的字体。也就是说,是的,您可以更改这些映射。但是“β变为P2”听起来好像在你的PDF中还有一些奇怪的东西。我明白问题是什么。。。由于PDF是从OCR读取的,因此某些字符不正确。。