亚马逊EC2实例中c#问题的itextSharp PDF到文本文件_C#_.net_Amazon Ec2_Itextsharp

亚马逊EC2实例中c#问题的itextSharp PDF到文本文件

c# .net amazon-ec2

亚马逊EC2实例中c#问题的itextSharp PDF到文本文件,c#,.net,amazon-ec2,itextsharp,C#,.net,Amazon Ec2,Itextsharp,我有一个非常奇怪的问题，可能是我不确定AmazonEC2实例中发生了什么我正在加载PDF并提取数据，然后使用iTextsharp组件（版本5.4.1）以字符串形式返回输出。在我的本地机器上工作绝对正常但当我部署到AmazonEC2实例（WindowsServer2008R2）时，它不工作，并且出现错误。我在日志文件中捕获了错误，如下所示 java.io.IOException: Error: End-of-File, expected line iTextSharp.text.excepti

我有一个非常奇怪的问题，可能是我不确定AmazonEC2实例中发生了什么

我正在加载PDF并提取数据，然后使用iTextsharp组件（版本5.4.1）以字符串形式返回输出。在我的本地机器上工作绝对正常

但当我部署到AmazonEC2实例（WindowsServer2008R2）时，它不工作，并且出现错误。我在日志文件中捕获了错误，如下所示

java.io.IOException: Error: End-of-File, expected line
iTextSharp.text.exceptions.InvalidPdfException: PDF header signature not found

我的代码如下，如有任何帮助/建议，将不胜感激

public static string parseUsingPDFBox(string PDFFilePath)
{
       PdfReader reader = new PdfReader(PDFFilePath);
       StringWriter output = new StringWriter();

       for (int i = 1; i <= reader.NumberOfPages; i++)
            output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));

       reader.Dispose();
       return output.ToString();
}

publicstaticstringparseusingpdfbox（stringpdffilepath）
{
PdfReader reader=新的PdfReader（PDFFilePath）；
StringWriter输出=新建StringWriter（）；
对于（int i=1；i请按如下方式调试：
创建一个FileInputStream
到PDFFilePath

将此流的字节
读入数组
检查前五个字节
在本地系统上，它们是'%'
，'p'
，'D'
，'F'
，'-'

在AmazonEC2实例上，它们不是
检查所有字节，看看有什么问题。
不走运，伙计……我可以获取PdfilePath的byte[]长度，但还是出现了一些问题。当你说“我可以获取PdfilePath的byte[]长度”是什么意思？我不理解你的评论。你能不能获取以“%PDF-”开头的字节数组的PDF？