Tensorflow 我的自定义对象检测器的这个盒子应该更小吗？_Tensorflow_Deep Learning_Computer Vision_Pytorch_Data Science

Tensorflow 我的自定义对象检测器的这个盒子应该更小吗？

tensorflow deep-learning computer-vision pytorch

Tensorflow 我的自定义对象检测器的这个盒子应该更小吗？,tensorflow,deep-learning,computer-vision,pytorch,data-science,Tensorflow,Deep Learning,Computer Vision,Pytorch,Data Science,因此，我试图为这家公司的表单制作一个对象检测器，我们已经按照我上传的示例图像对图像进行了标记，我的问题是：我们应该制作更精确的框，还是可以这样做，因为我们试图检测的书面部分可能会更大所以，我要问的是：在示例图像中，“Description”部分或描述只有两行文本，但可能更多，我们是否应该让这个框只选择描述标题+两行，或者我们坚持我们现在正在做的事情，标题+两行+所有可能用行填充的空白，这取决于您对检测到的框真正想要做什么。下一步是什么，下一步（例如提取文本）可以处理所有可用空间，还是只处理实际

因此，我试图为这家公司的表单制作一个对象检测器，我们已经按照我上传的示例图像对图像进行了标记，我的问题是：我们应该制作更精确的框，还是可以这样做，因为我们试图检测的书面部分可能会更大

所以，我要问的是：在示例图像中，“Description”部分或描述只有两行文本，但可能更多，我们是否应该让这个框只选择描述标题+两行，或者我们坚持我们现在正在做的事情，标题+两行+所有可能用行填充的空白，这取决于您对检测到的框真正想要做什么。下一步是什么，下一步（例如提取文本）可以处理所有可用空间，还是只处理实际写入的部分更好

除此之外，在你的例子中，我发现大多数盒子都太大了。表格或多或少已经分为多个方框，最好使方框更小、更准确，例如IMPORTE周围的方框和一些欧元金额。我会给它贴上更近的标签。因此，该框仅包含您实际需要的信息，而不包含其他信息

但正如我所说的，这实际上取决于下一步应该使用这些框。

我们希望获取检测到的框，并将其通过tesseract来提取文本，然后我们对文本应用正则表达式并将其存储在.csv中，这样我们就可以在一列中包含每个表单字段（即方向、数量…）。所以简而言之，我们想把收到的表单的信息放在一个csv中。我认为，正如你所说的，我们应该把框放小一些，以检测它实际上是写了什么来处理它。框看起来太随意了。您可以将它们缩小以适应文本，使网络了解文本所在的位置，或者如果您的文档都相似，则可以将框缩小以适应区域。对于区域，您甚至可以将区域分类为描述、导入等。我仍然认为你可以用opencv解决这个特殊的图像，但是，应该很容易识别矩形区域