Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/298.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# PDFClown检测空文本位置_C#_Extractor_Pdfclown - Fatal编程技术网

C# PDFClown检测空文本位置

C# PDFClown检测空文本位置,c#,extractor,pdfclown,C#,Extractor,Pdfclown,我能够使用C#中的PDFClown库解析和提取PDF格式的每日报告中的文本。我遇到的问题是检测文本值何时丢失。使用TextExtractor,文本值中没有我期望的占位符。PDF文档中有一个框,其中应该有缺失的文本,因此似乎应该有某种方法来检测不存在的值。此文档中没有表单。我个人会选择WKHTMLToPDF或ITextSharp而不是PDFClown。@David theTextExtractor提取文本。框不是文本(通常不是)。因此,TextExtractor不会提取它。TextExtracto

我能够使用C#中的PDFClown库解析和提取PDF格式的每日报告中的文本。我遇到的问题是检测文本值何时丢失。使用TextExtractor,文本值中没有我期望的占位符。PDF文档中有一个框,其中应该有缺失的文本,因此似乎应该有某种方法来检测不存在的值。此文档中没有表单。

我个人会选择WKHTMLToPDF或ITextSharp而不是PDFClown。@David the
TextExtractor
提取文本。框不是文本(通常不是)。因此,
TextExtractor
不会提取它。TextExtractor返回一个文本字符串列表,PDF中的每行文本对应一个字符串,整行文本对应一个二维矩形的坐标。如果每个文本字符串周围都有一个二维矩形,我可能会做我需要做的事情。我还没有找到办法。我个人会选择WKHTMLToPDF或ITextSharp而不是PDFClown。@David the
TextExtractor
提取文本。框不是文本(通常不是)。因此,
TextExtractor
不会提取它。TextExtractor返回一个文本字符串列表,PDF中的每行文本对应一个字符串,整行文本对应一个二维矩形的坐标。如果每个文本字符串周围都有一个二维矩形,我可能会做我需要做的事情。我还没有找到一个办法。