C# tesseract(.NET)和#x2B;可搜索的PDF。如何申请?

C# tesseract(.NET)和#x2B;可搜索的PDF。如何申请?,c#,pdf-generation,ocr,tesseract,tessnet2,C#,Pdf Generation,Ocr,Tesseract,Tessnet2,我需要开发一个系统,将图像转换为可搜索的PDF。 学校工作怎么样?我需要一些开源的东西 经过大量研究,我发现了tessnet2(tesseract),我可以删除tiff格式的文本图像。 但是如何将这些信息转换成PDF格式呢? 注意:我需要保留文件结构 我需要一个方向来继续我的研究。谁来帮帮我 谢谢您可能想在Tesseract页面上查看几个.NET hOCR到PDF库。我想要做到这一点,您需要一个OCR库来完成这项工作。这是一个有点太复杂了,无法在QnA网站上讨论。沙克蒂你建议我做什么?我建议使用

我需要开发一个系统,将图像转换为可搜索的PDF。 学校工作怎么样?我需要一些开源的东西 经过大量研究,我发现了tessnet2(tesseract),我可以删除tiff格式的文本图像。 但是如何将这些信息转换成PDF格式呢? 注意:我需要保留文件结构

我需要一个方向来继续我的研究。谁来帮帮我


谢谢

您可能想在Tesseract页面上查看几个.NET hOCR到PDF库。

我想要做到这一点,您需要一个OCR库来完成这项工作。这是一个有点太复杂了,无法在QnA网站上讨论。沙克蒂你建议我做什么?我建议使用:就像我自己做这种类型的工作。可以学习代码,从两次扫描中将新轮廓识别为字体。我自己使用它来检测车牌。user2754599-据我所知,它将帮助我检测文本,太棒了!但是如何转换成可搜索的pdf?已经非常有用了,有没有关于如何在windows上应用的示例?网站上有一些代码示例。您可以使用输出hOCR字符串作为库的输入。