C# 在使用iTextSharp从PDF文件提取文本时,我遇到了以下错误:“No No No modHFGen.dll;找不到图像数据或EI“;
使用iTextSharp从PDF文件中提取文本时,我遇到以下错误:“找不到图像数据或EI” 此错误发生在仅包含图像的特定页面上C# 在使用iTextSharp从PDF文件提取文本时,我遇到了以下错误:“No No No modHFGen.dll;找不到图像数据或EI“;,c#,itextsharp,C#,Itextsharp,使用iTextSharp从PDF文件中提取文本时,我遇到以下错误:“找不到图像数据或EI” 此错误发生在仅包含图像的特定页面上 原因可能是因为我试图在不检查页面中是否有任何文本内容的情况下提取文本?内联图像在PDF规范中没有很好地指定。图像数据应包含在ID和EI操作员之间。但图像数据本身可能包含“EI”。 在iText(夏普)中,读取图像数据直到遇到EI。但是,有些PDF将EI作为内联图像数据的结尾。对于那些内联图像,iText(Sharp)抛出此异常 如果您的PDF存在此问题,您可能可以通过将
原因可能是因为我试图在不检查页面中是否有任何文本内容的情况下提取文本?内联图像在PDF规范中没有很好地指定。图像数据应包含在
ID
和EI
操作员之间。但图像数据本身可能包含“EI”。
在iText(夏普)中,读取图像数据直到遇到EI
。但是,有些PDF将EI
作为内联图像数据的结尾。对于那些内联图像,iText(Sharp)抛出此异常
如果您的PDF存在此问题,您可能可以通过将
found==1
更改为found来解决此问题。这是因为计算机分辨率太高,重印时使用的分辨率较低。没关系,但基本配置文件仍然来自源代码。也就是说,支持多种计算机分辨率。解析未被EndImage标记正确关闭的内联图像(或其内容被乱码,使iText错过该标记)时,会抛出InlineImageParseException(“找不到图像数据或EI”)
。你能提供文件进行分析吗?对不起伙计们。。那是一份非常机密的文件,所以我不能和你分享。如果你找到任何解决办法,请告诉我。谢谢您使用的是什么版本的iTextSharp?有人说这是在5.0.6中修复的,否则我看到的唯一两个解决方案是修复PDF或使用iTextSharp 5.4.4.0使用try/catchAm进行包装。。我已经用try/catch块完成了包装。然后我将转到5.0.6。如果有任何问题,请告诉你。。谢谢你的快速回复…非常感谢。。