亚马逊EC2实例中c#问题的itextSharp PDF到文本文件
我有一个非常奇怪的问题,可能是我不确定AmazonEC2实例中发生了什么 我正在加载PDF并提取数据,然后使用iTextsharp组件(版本5.4.1)以字符串形式返回输出。在我的本地机器上工作绝对正常 但当我部署到AmazonEC2实例(WindowsServer2008R2)时,它不工作,并且出现错误。我在日志文件中捕获了错误,如下所示亚马逊EC2实例中c#问题的itextSharp PDF到文本文件,c#,.net,amazon-ec2,itextsharp,C#,.net,Amazon Ec2,Itextsharp,我有一个非常奇怪的问题,可能是我不确定AmazonEC2实例中发生了什么 我正在加载PDF并提取数据,然后使用iTextsharp组件(版本5.4.1)以字符串形式返回输出。在我的本地机器上工作绝对正常 但当我部署到AmazonEC2实例(WindowsServer2008R2)时,它不工作,并且出现错误。我在日志文件中捕获了错误,如下所示 java.io.IOException: Error: End-of-File, expected line iTextSharp.text.excepti
java.io.IOException: Error: End-of-File, expected line
iTextSharp.text.exceptions.InvalidPdfException: PDF header signature not found
我的代码如下,如有任何帮助/建议,将不胜感激
public static string parseUsingPDFBox(string PDFFilePath)
{
PdfReader reader = new PdfReader(PDFFilePath);
StringWriter output = new StringWriter();
for (int i = 1; i <= reader.NumberOfPages; i++)
output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));
reader.Dispose();
return output.ToString();
}
publicstaticstringparseusingpdfbox(stringpdffilepath)
{
PdfReader reader=新的PdfReader(PDFFilePath);
StringWriter输出=新建StringWriter();
对于(int i=1;i请按如下方式调试:
创建一个FileInputStream
到PDFFilePath
将此流的字节
读入数组
检查前五个字节
在本地系统上,它们是'%'
,'p'
,'D'
,'F'
,'-'
在AmazonEC2实例上,它们不是
检查所有字节,看看有什么问题。不走运,伙计……我可以获取PdfilePath的byte[]长度,但还是出现了一些问题。当你说“我可以获取PdfilePath的byte[]长度”是什么意思?我不理解你的评论。你能不能获取以“%PDF-”开头的字节数组的PDF?