如何使用imagemagick从pdf框中裁剪签名?

如何使用imagemagick从pdf框中裁剪签名?,imagemagick,Imagemagick,我需要从扫描文件中提取带有手写签名的盒子 我的PDF格式如下所示: 人们会下载这个,签名,然后上传给我。我如何提取签名盒的内部?(如果需要,我可以修改PDF,添加一些边框、条形码,任何有帮助的东西。) 我试过各种imagemagick的东西。我可以得到估计的坐标,比如: convert -crop 350x75+180+300 mock.pdf mock.png 它让我接近,但不精确(人们的扫描方式不同)。但现在我有了这个提取的签名: 现在我仍然不知道如何进入盒子,只裁剪那部分。我尝试过一些

我需要从扫描文件中提取带有手写签名的盒子

我的PDF格式如下所示:

人们会下载这个,签名,然后上传给我。我如何提取签名盒的内部?(如果需要,我可以修改PDF,添加一些边框、条形码,任何有帮助的东西。)

我试过各种imagemagick的东西。我可以得到估计的坐标,比如:

convert -crop 350x75+180+300 mock.pdf mock.png
它让我接近,但不精确(人们的扫描方式不同)。但现在我有了这个提取的签名:

现在我仍然不知道如何进入盒子,只裁剪那部分。我尝试过一些修剪和绒毛,甚至multicrop,但没有真正的效果

我尝试过的一些例子:

convert -fuzz 10% -bordercolor black -border 2x2 -trim +repage

convert -trim

convert -trim +repage

multicrop -f 10% -b black -border 1x1 -trim + repage

multicrop -f 10% -b white -border 1x1 -trim + repage
我只需要在边框周围修剪白色,但不能达到一个像素

我甚至试着用tesseract在这里找到单词符号,提取坐标,并从中近似坐标——但我仍然遇到同样的问题,如何只获取盒子的内部

我还能试什么

我可以在一个shell文件中通过管道传输多个convert命令,这没有问题。背景(可能类似于白色,取决于扫描)可以提取,没有问题-事实上,这是期望的效果,最终使其透明,但不想让这成为问题的一部分,如果它将使事情复杂化


非常感谢任何我可以尝试的例子。

假设你周围有一个实际的黑盒子,这可能是一个复制品,我不确定你到底想要什么。我想你知道盒子的坐标,为什么不在黑盒子的轮廓内裁剪呢。可能转换-裁剪355x78+175+290 mock.pdf mock。png@Paul谢谢,但我不知道箱子的确切坐标。我在原始表格上做了,但是人们会打印出来,然后签名,然后扫描签名的表格。当他们扫描的时候,他们可能会把扫描移到这里或那里,使盒子偏离我的原始坐标。所以我只知道盒子的近似坐标。获得完全100%的准确度而没有错误可能是一个挑战。我们必须假设多少最坏情况分析?如果用户在你的盒子里画另一个盒子来欺骗你的程序呢?用户可以这样做吗?如果用户画了一个大的签名,这个签名在盒子外面会怎样?如果用户将纸张以45度角旋转到扫描仪中会怎样?在这种情况下,即使是上面的裁剪技巧也无法获得近似区域。好吧,合理的也可以,而不是精确的。如果你能帮我得到一个convert命令,它只需要在框内距框边一到两毫米就可以了。如果用户旋转sig,我可以接受,告诉用户他需要再次扫描。如果用户试图做一些诡计,那也没问题,这件事最终还是交给了人工操作人员。我确实在它周围有一个盒子。我确实尝试过这种方法,但我还有另外两个框(来自PDF),它们似乎混淆了我的算法,因此我无法提取准确的坐标。如果你对你要查找的框有一个大致的概念,你能裁剪到页面的四分之一左右,然后尝试算法吗?这就是我现在正在做的,从盒子内大致裁剪。但我可能会尝试——扩展搜索范围,只查看右下角的四分之一,然后找到我的方框。无论如何,这是一个相对较好的答案,这是悬赏:)在它到期之前,它不会给任何人。