如何在c中使用itextsharp读取Unicode pdf？_Pdf_Unicode_Itextsharp

如何在c中使用itextsharp读取Unicode pdf？

pdf unicode

如何在c中使用itextsharp读取Unicode pdf？,pdf,unicode,itextsharp,Pdf,Unicode,Itextsharp,我正在从事基于Unicode[Marathi]的项目，对于这个项目，我的任务是从PDF中读取以下字体的Unicode文本 CDAC Gisturekh CDAC Gisturekh+0 CDAC Gisturekh+1 CDAC GISTSurekh+0加粗 CDAC GISTSurekh+1加粗当我使用iTextSharp阅读PDF时，我得到的文本如下： ररजज - (एस 13) महरररषष पररप मतदरर जरदद 2014 实际文本应该在哪里 राज्य - (एस-१३

我正在从事基于Unicode[Marathi]的项目，对于这个项目，我的任务是从PDF中读取以下字体的Unicode文本

CDAC Gisturekh CDAC Gisturekh+0 CDAC Gisturekh+1 CDAC GISTSurekh+0加粗 CDAC GISTSurekh+1加粗当我使用iTextSharp阅读PDF时，我得到的文本如下：

ररजज - (एस 13) महरररषष
पररप मतदरर जरदद 2014

实际文本应该在哪里

राज्य - (एस-१३) महाराष्ट्र  प्रारूप मतदार यादी २०१४

如果有人知道这一点，请给我解决方案。

您的输出显示您已经在阅读Unicode，如果失败，您就不会看到Marathi。您能否提供指向具有此行为的示例PDF的链接？请检查这是示例PDF的链接。此PDF存在与中描述的问题完全相同的问题，包括相同的重复Unicode代码点。iTextSharp和Acrobat Pro都无法解决这一问题。嗨，我也在使用iTextSharp创建pdf，但当pdf使用马拉地文字打印时，某些联合词打印不正确。例如—मिरची 印刷为मरीची , पत्ते 印刷为पतेते .请给出解决方案。