如何在c中使用itextsharp读取Unicode pdf?

如何在c中使用itextsharp读取Unicode pdf?,pdf,unicode,itextsharp,Pdf,Unicode,Itextsharp,我正在从事基于Unicode[Marathi]的项目,对于这个项目,我的任务是从PDF中读取以下字体的Unicode文本 CDAC Gisturekh CDAC Gisturekh+0 CDAC Gisturekh+1 CDAC GISTSurekh+0加粗 CDAC GISTSurekh+1加粗 当我使用iTextSharp阅读PDF时,我得到的文本如下: ररजज - (एस 13) महरररषष पररप मतदरर जरदद 2014 实际文本应该在哪里 राज्य - (एस-१३

我正在从事基于Unicode[Marathi]的项目,对于这个项目,我的任务是从PDF中读取以下字体的Unicode文本

CDAC Gisturekh CDAC Gisturekh+0 CDAC Gisturekh+1 CDAC GISTSurekh+0加粗 CDAC GISTSurekh+1加粗 当我使用iTextSharp阅读PDF时,我得到的文本如下:

ररजज - (एस 13) महरररषष
पररप मतदरर जरदद 2014
实际文本应该在哪里

राज्य - (एस-१३) महाराष्ट्र  प्रारूप मतदार यादी २०१४

如果有人知道这一点,请给我解决方案。

您的输出显示您已经在阅读Unicode,如果失败,您就不会看到Marathi。您能否提供指向具有此行为的示例PDF的链接?请检查这是示例PDF的链接。此PDF存在与中描述的问题完全相同的问题,包括相同的重复Unicode代码点。iTextSharp和Acrobat Pro都无法解决这一问题。嗨,我也在使用iTextSharp创建pdf,但当pdf使用马拉地文字打印时,某些联合词打印不正确。例如—मिरची 印刷为मरीची , पत्ते 印刷为पतेते .请给出解决方案。