C# 确定PDF在C中是否只有页眉和页脚#

C# 确定PDF在C中是否只有页眉和页脚#,c#,pdf,system.io.fileinfo,C#,Pdf,System.io.fileinfo,是否有一种确定的方法来检查现有的PDF文件,只检查要填充的页眉和页脚 我运行一个控制台应用程序,将现有PDF合并成一个PDF(FileA.PDF、FileB.PDF和FileC.PDF变成FileABC.PDF) 需要注意的是,我需要检查PDF是否为空或已填充。如果文件为空,则从合并中忽略该文件(FileB.pdf为空,因此合并的文件为FileAC.pdf)。然而,一个空文件仍然会有页眉和页脚,只是没有正文内容,我需要对此进行说明 我目前所做的是手动收集所有不同空PDF的字节大小,并使用Syst

是否有一种确定的方法来检查现有的PDF文件,只检查要填充的页眉和页脚

我运行一个控制台应用程序,将现有PDF合并成一个PDF(FileA.PDF、FileB.PDF和FileC.PDF变成FileABC.PDF)

需要注意的是,我需要检查PDF是否为空或已填充。如果文件为空,则从合并中忽略该文件(FileB.pdf为空,因此合并的文件为FileAC.pdf)。然而,一个空文件仍然会有页眉和页脚,只是没有正文内容,我需要对此进行说明

我目前所做的是手动收集所有不同空PDF的字节大小,并使用
System.IO.FileInfo
比较文件大小是否大于记录的空大小


虽然这种方法在99%的时间内都有效,但有时会出现异常,空PDF会高出1到2个字节,从而允许空文件通过。

这是可能的,但不是很容易。您最好使用第三方代码库(如iTextSharp)来解析PDF,并为您提供表示PDF中元素的代码对象(表、文本块、图像等)。此时,您需要编写自定义代码来循环元素对象并应用逻辑。例如,如果页眉元素和页脚元素之间没有元素,或者如果有元素,但它们都是只包含空格的文本块,那么您知道这是一个“空”PDF。事实上,单靠FileInfo是没有帮助的,您需要一个PDF库。但不要期望从pdf中轻松提取表。通常pdf中的表格只是一组文本片段,可能还有一些线条或背景颜色矩形。。。