Tensorflow 我的自定义对象检测器的这个盒子应该更小吗?

Tensorflow 我的自定义对象检测器的这个盒子应该更小吗?,tensorflow,deep-learning,computer-vision,pytorch,data-science,Tensorflow,Deep Learning,Computer Vision,Pytorch,Data Science,因此,我试图为这家公司的表单制作一个对象检测器,我们已经按照我上传的示例图像对图像进行了标记,我的问题是:我们应该制作更精确的框,还是可以这样做,因为我们试图检测的书面部分可能会更大 所以,我要问的是:在示例图像中,“Description”部分或描述只有两行文本,但可能更多,我们是否应该让这个框只选择描述标题+两行,或者我们坚持我们现在正在做的事情,标题+两行+所有可能用行填充的空白,这取决于您对检测到的框真正想要做什么。下一步是什么,下一步(例如提取文本)可以处理所有可用空间,还是只处理实际

因此,我试图为这家公司的表单制作一个对象检测器,我们已经按照我上传的示例图像对图像进行了标记,我的问题是:我们应该制作更精确的框,还是可以这样做,因为我们试图检测的书面部分可能会更大


所以,我要问的是:在示例图像中,“Description”部分或描述只有两行文本,但可能更多,我们是否应该让这个框只选择描述标题+两行,或者我们坚持我们现在正在做的事情,标题+两行+所有可能用行填充的空白,这取决于您对检测到的框真正想要做什么。下一步是什么,下一步(例如提取文本)可以处理所有可用空间,还是只处理实际写入的部分更好

除此之外,在你的例子中,我发现大多数盒子都太大了。表格或多或少已经分为多个方框,最好使方框更小、更准确,例如IMPORTE周围的方框和一些欧元金额。我会给它贴上更近的标签。因此,该框仅包含您实际需要的信息,而不包含其他信息


但正如我所说的,这实际上取决于下一步应该使用这些框。

我们希望获取检测到的框,并将其通过tesseract来提取文本,然后我们对文本应用正则表达式并将其存储在.csv中,这样我们就可以在一列中包含每个表单字段(即方向、数量…)。所以简而言之,我们想把收到的表单的信息放在一个csv中。我认为,正如你所说的,我们应该把框放小一些,以检测它实际上是写了什么来处理它。框看起来太随意了。您可以将它们缩小以适应文本,使网络了解文本所在的位置,或者如果您的文档都相似,则可以将框缩小以适应区域。对于区域,您甚至可以将区域分类为描述、导入等。我仍然认为你可以用opencv解决这个特殊的图像,但是,应该很容易识别矩形区域