C# 获取PDF图像中的详细信息
得到了这一系列的PDF,我需要得到里面的所有细节。我已经可以使用iTextsharp获得一些文本细节,但问题是,一些PDF有图像,而该图像包含一些细节 那么我有没有可能把这些图片和细节放在里面?作为下面的示例图像,我想得到单词“头眼”、“身体正方形”和“脚正方形”。我不需要“绘图”,我需要的是图像中的单词C# 获取PDF图像中的详细信息,c#,.net,image,pdf,itextsharp,C#,.net,Image,Pdf,Itextsharp,得到了这一系列的PDF,我需要得到里面的所有细节。我已经可以使用iTextsharp获得一些文本细节,但问题是,一些PDF有图像,而该图像包含一些细节 那么我有没有可能把这些图片和细节放在里面?作为下面的示例图像,我想得到单词“头眼”、“身体正方形”和“脚正方形”。我不需要“绘图”,我需要的是图像中的单词 如果有一些API/库可以在我的.NETC#应用程序中使用,那就太好了。谢谢 如果您试图读取的文本位于图像上或混合,则可以使用光栅化PDF(将PDF页面转换为图像),然后使用从该图像的各个部分读
如果有一些API/库可以在我的.NETC#应用程序中使用,那就太好了。谢谢 如果您试图读取的文本位于图像上或混合,则可以使用光栅化PDF(将PDF页面转换为图像),然后使用从该图像的各个部分读取文本 由于您希望通过.NET(C#)执行此操作,因此可以从以下位置获取这两个组件的.NET包装器: Ghostscript.NET:
tesseract ocr.net:读取这些图像位图图像,并且是该图像的写入部分吗?在这种情况下,您必须对可以使用iTextSharp提取的图像应用OCR。否则,您应该成功地使用iTextSharp文本提取功能。