Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/github/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用C#检查非表单PDF上是否选中复选框?_C#_Pdf_Itextsharp_Pdf Parsing - Fatal编程技术网

如何使用C#检查非表单PDF上是否选中复选框?

如何使用C#检查非表单PDF上是否选中复选框?,c#,pdf,itextsharp,pdf-parsing,C#,Pdf,Itextsharp,Pdf Parsing,使用c#,我想查看PDF页面上是否选中了特定的复选框。PDF文件不是表单文件 PDF可能类似于: 示例文件如下: (在这个示例文件中,我想弄清楚问题A1000中的复选框“E”是否被选中。同样,PDF不是“格式”格式!) PS:以下帖子都没有解决我的问题: OCR可能是唯一的方法。从PDF的角度来看,有一个矩形,其中一些矩形有两条线穿过它们。它们甚至不是图像,而是实际的矢量绘图命令。你可能会寻找“x”的额外图形,但它与它旁边的文本无关,因此我们必须编写一些模糊逻辑来估计“x”与“文本”之间的

使用c#,我想查看PDF页面上是否选中了特定的复选框。PDF文件不是表单文件

PDF可能类似于:

示例文件如下: (在这个示例文件中,我想弄清楚问题A1000中的复选框“E”是否被选中。同样,PDF不是“格式”格式!)

PS:以下帖子都没有解决我的问题:


    • OCR可能是唯一的方法。从PDF的角度来看,有一个矩形,其中一些矩形有两条线穿过它们。它们甚至不是图像,而是实际的矢量绘图命令。你可能会寻找“x”的额外图形,但它与它旁边的文本无关,因此我们必须编写一些模糊逻辑来估计“x”与“文本”之间的关系,我认为最终会出现一系列误报。如果你有一堆这样的PDF文件,可能值得写点东西,否则就需要OCR或手工输入


      如果你想解析PDF,你可以试试看,这有点难看,但是如果你一遍又一遍地解析同一个PDF,它可能就可以了。如果你想要更通用和可重用的东西,我会去看看iText的创建者。他的帖子是针对可选内容组的,但它应该会给你一些开始的想法。

      所以类似于?OCR可能是唯一的方法。从PDF的角度来看,有一个矩形,其中一些矩形有两条线穿过它们。它们甚至不是图像,而是实际的矢量绘图命令。你可能会寻找“x”的额外图形,但它与它旁边的文本无关,因此我们必须编写一些模糊逻辑来估计“x”与“文本”之间的关系,我认为最终会出现一系列误报。如果你有一堆这样的东西,可能值得写一些东西,否则用OCR或手工输入。@ChrisHaas-因此,如果a能以某种方式获得该复选框的位置和其中的“X”,我就可以找出其余的。你知道我怎么做吗?有任何示例代码吗?您可以尝试使用有点难看的代码,但是如果您反复解析同一个PDF,它可能会正常工作。如果你想要更通用和可重用的东西,我会去看看iText的创建者。他的帖子是为可选内容组写的,但它应该会给你一些开始的想法。谢谢@ChrisHaas。我现在正在努力,我想我的方向很好,多亏了你。请合并您的两条评论并将其作为答案输入,我会将它们标记为正确答案。它将帮助有同样问题的人。