C# 获取PDF图像中的详细信息_C#_.net_Image_Pdf_Itextsharp

C# 获取PDF图像中的详细信息

c# .net image pdf

C# 获取PDF图像中的详细信息,c#,.net,image,pdf,itextsharp,C#,.net,Image,Pdf,Itextsharp,得到了这一系列的PDF，我需要得到里面的所有细节。我已经可以使用iTextsharp获得一些文本细节，但问题是，一些PDF有图像，而该图像包含一些细节那么我有没有可能把这些图片和细节放在里面？作为下面的示例图像，我想得到单词“头眼”、“身体正方形”和“脚正方形”。我不需要“绘图”，我需要的是图像中的单词如果有一些API/库可以在我的.NETC#应用程序中使用，那就太好了。谢谢如果您试图读取的文本位于图像上或混合，则可以使用光栅化PDF（将PDF页面转换为图像），然后使用从该图像的各个部分读

得到了这一系列的PDF，我需要得到里面的所有细节。我已经可以使用iTextsharp获得一些文本细节，但问题是，一些PDF有图像，而该图像包含一些细节

那么我有没有可能把这些图片和细节放在里面？作为下面的示例图像，我想得到单词“头眼”、“身体正方形”和“脚正方形”。我不需要“绘图”，我需要的是图像中的单词

如果有一些API/库可以在我的.NETC#应用程序中使用，那就太好了。谢谢

如果您试图读取的文本位于图像上或混合，则可以使用光栅化PDF（将PDF页面转换为图像），然后使用从该图像的各个部分读取文本

由于您希望通过.NET（C#）执行此操作，因此可以从以下位置获取这两个组件的.NET包装器：

Ghostscript.NET：

tesseract ocr.net:

读取这些图像位图图像，并且是该图像的写入部分吗？在这种情况下，您必须对可以使用iTextSharp提取的图像应用OCR。否则，您应该成功地使用iTextSharp文本提取功能。