C# PDFClown检测空文本位置
我能够使用C#中的PDFClown库解析和提取PDF格式的每日报告中的文本。我遇到的问题是检测文本值何时丢失。使用TextExtractor,文本值中没有我期望的占位符。PDF文档中有一个框,其中应该有缺失的文本,因此似乎应该有某种方法来检测不存在的值。此文档中没有表单。我个人会选择WKHTMLToPDF或ITextSharp而不是PDFClown。@David theC# PDFClown检测空文本位置,c#,extractor,pdfclown,C#,Extractor,Pdfclown,我能够使用C#中的PDFClown库解析和提取PDF格式的每日报告中的文本。我遇到的问题是检测文本值何时丢失。使用TextExtractor,文本值中没有我期望的占位符。PDF文档中有一个框,其中应该有缺失的文本,因此似乎应该有某种方法来检测不存在的值。此文档中没有表单。我个人会选择WKHTMLToPDF或ITextSharp而不是PDFClown。@David theTextExtractor提取文本。框不是文本(通常不是)。因此,TextExtractor不会提取它。TextExtracto
TextExtractor
提取文本。框不是文本(通常不是)。因此,TextExtractor
不会提取它。TextExtractor返回一个文本字符串列表,PDF中的每行文本对应一个字符串,整行文本对应一个二维矩形的坐标。如果每个文本字符串周围都有一个二维矩形,我可能会做我需要做的事情。我还没有找到办法。我个人会选择WKHTMLToPDF或ITextSharp而不是PDFClown。@David theTextExtractor
提取文本。框不是文本(通常不是)。因此,TextExtractor
不会提取它。TextExtractor返回一个文本字符串列表,PDF中的每行文本对应一个字符串,整行文本对应一个二维矩形的坐标。如果每个文本字符串周围都有一个二维矩形,我可能会做我需要做的事情。我还没有找到一个办法。