亚马逊EC2实例中c#问题的itextSharp PDF到文本文件

亚马逊EC2实例中c#问题的itextSharp PDF到文本文件,c#,.net,amazon-ec2,itextsharp,C#,.net,Amazon Ec2,Itextsharp,我有一个非常奇怪的问题,可能是我不确定AmazonEC2实例中发生了什么 我正在加载PDF并提取数据,然后使用iTextsharp组件(版本5.4.1)以字符串形式返回输出。在我的本地机器上工作绝对正常 但当我部署到AmazonEC2实例(WindowsServer2008R2)时,它不工作,并且出现错误。我在日志文件中捕获了错误,如下所示 java.io.IOException: Error: End-of-File, expected line iTextSharp.text.excepti

我有一个非常奇怪的问题,可能是我不确定AmazonEC2实例中发生了什么

我正在加载PDF并提取数据,然后使用iTextsharp组件(版本5.4.1)以字符串形式返回输出。在我的本地机器上工作绝对正常

但当我部署到AmazonEC2实例(WindowsServer2008R2)时,它不工作,并且出现错误。我在日志文件中捕获了错误,如下所示

java.io.IOException: Error: End-of-File, expected line
iTextSharp.text.exceptions.InvalidPdfException: PDF header signature not found
我的代码如下,如有任何帮助/建议,将不胜感激

public static string parseUsingPDFBox(string PDFFilePath)
{
       PdfReader reader = new PdfReader(PDFFilePath);
       StringWriter output = new StringWriter();

       for (int i = 1; i <= reader.NumberOfPages; i++)
            output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));

       reader.Dispose();
       return output.ToString();
}
publicstaticstringparseusingpdfbox(stringpdffilepath)
{
PdfReader reader=新的PdfReader(PDFFilePath);
StringWriter输出=新建StringWriter();

对于(int i=1;i请按如下方式调试:

创建一个
FileInputStream
PDFFilePath

将此流的
字节
读入数组

检查前五个字节

在本地系统上,它们是
'%'
'p'
'D'
'F'
'-'

在AmazonEC2实例上,它们不是


检查所有字节,看看有什么问题。

不走运,伙计……我可以获取PdfilePath的byte[]长度,但还是出现了一些问题。当你说“我可以获取PdfilePath的byte[]长度”是什么意思?我不理解你的评论。你能不能获取以“%PDF-”开头的字节数组的PDF?