Tensorflow 是否应使用深度学习分类对瓶子中的液位等细节进行分类

Tensorflow 是否应使用深度学习分类对瓶子中的液位等细节进行分类,tensorflow,computer-vision,deep-learning,Tensorflow,Computer Vision,Deep Learning,deep learning classification可用于精确地标记/分类对象及其特征之一。例如,识别瓶子(如威士忌)和瓶子中的液位(以10%的步长-如50%满)。这是利用一些深度学习框架(Tensorflow等)或其他更有效的方法可以最好地解决的问题吗?好吧,如果酒的颜色好,这应该是可能的。如果不是(例如杜松子酒、伏特加),我想说,当你从自然视角和距离观察物体时,你就没有机会使用今天的技术 对于有色液体,我会训练两个探测器。一个用于检测瓶子,另一个用于检测提供给瓶子的酒。两者之间的比率将是

deep learning classification
可用于精确地
标记/分类对象及其特征之一。例如,识别瓶子(如威士忌)和瓶子中的液位(以10%的步长-如50%满)。这是利用一些
深度学习框架
(Tensorflow等)或其他更有效的方法可以最好地解决的问题吗?

好吧,如果酒的颜色好,这应该是可能的。如果不是(例如杜松子酒、伏特加),我想说,当你从自然视角和距离观察物体时,你就没有机会使用今天的技术

对于有色液体,我会训练两个探测器。一个用于检测瓶子,另一个用于检测提供给瓶子的酒。两者之间的比率将是您的百分比

一些经过验证的最先进的基于深度学习的对象检测器(只需谷歌搜索):

  • 多箱
  • 约洛
  • 快速RCNN
或非深度学习型:

  • 可变形零件模型
编辑:

我被要求详细说明。以下是一个例子:

例如,盒子检测器在图像中[0.1,0.2,0.5,0.6](最小高度,最小宽度,最大高度,最大宽度)处绘制一个盒子,这是瓶子的相对位置

现在,从原始图像裁剪瓶子,并将其送入第二个检测器。第二个检测器在裁剪的瓶子图像中绘制,例如[0.2,0.3,0.7,0.8],该位置表示检测到的液体。现在(0.7-0.2)*(0.8-0.3)=0.25是液体相对于瓶子面积的相对面积,这是OP要求的

编辑2:

我输入了这个回复,假设OP想要使用深度学习。我同意如果OP仍然不确定深度学习,应该考虑其他方法。对于瓶子检测,基于深度学习的方法已经显示出比传统方法有很大的优势。瓶子检测恰好是PASCAL VOC挑战中的一类。请参见此处的结果比较:


然而,对于液体检测,深度学习可能有点过头了。例如,如果你知道你想要什么颜色,即使是一个简单的滤色器也会给你“一些东西”

嗯,如果酒的颜色好的话,这应该是可能的。如果不是(例如杜松子酒、伏特加),我想说,当你从自然视角和距离观察物体时,你就没有机会使用今天的技术

对于有色液体,我会训练两个探测器。一个用于检测瓶子,另一个用于检测提供给瓶子的酒。两者之间的比率将是您的百分比

一些经过验证的最先进的基于深度学习的对象检测器(只需谷歌搜索):

  • 多箱
  • 约洛
  • 快速RCNN
或非深度学习型:

  • 可变形零件模型
编辑:

我被要求详细说明。以下是一个例子:

例如,盒子检测器在图像中[0.1,0.2,0.5,0.6](最小高度,最小宽度,最大高度,最大宽度)处绘制一个盒子,这是瓶子的相对位置

现在,从原始图像裁剪瓶子,并将其送入第二个检测器。第二个检测器在裁剪的瓶子图像中绘制,例如[0.2,0.3,0.7,0.8],该位置表示检测到的液体。现在(0.7-0.2)*(0.8-0.3)=0.25是液体相对于瓶子面积的相对面积,这是OP要求的

编辑2:

我输入了这个回复,假设OP想要使用深度学习。我同意如果OP仍然不确定深度学习,应该考虑其他方法。对于瓶子检测,基于深度学习的方法已经显示出比传统方法有很大的优势。瓶子检测恰好是PASCAL VOC挑战中的一类。请参见此处的结果比较:


然而,对于液体检测,深度学习可能有点过头了。例如,如果你知道你想要什么颜色,即使是一个简单的滤色器也会给你“一些东西”

深度学习的经验法则是,如果它在图像中可见,因此专家可以仅根据图像告诉您答案,那么如果有足够的带注释的数据,您可以通过深度学习来了解这一点的几率非常高

但是,您不太可能拥有执行此任务所需的数据,因此,如果我可以简化此问题,我会问自己一个问题。例如,你可以拿杜松子酒、伏特加等酒,用筛子在新场景中再次找到瓶子。然后RANSAC进行瓶子检测,并将瓶子从图像中剪掉


然后我会尝试使用梯度特征来找到液位的边缘。最后,您可以使用(液体边缘-底部)/(顶部瓶-底部瓶)计算百分比

深度学习的经验法则是,如果它在图像中可见,因此专家可以仅根据图像告诉您答案,那么如果有足够的带注释的数据,您可以通过深度学习来了解这一点的几率非常高

但是,您不太可能拥有执行此任务所需的数据,因此,如果我可以简化此问题,我会问自己一个问题。例如,你可以拿杜松子酒、伏特加等酒,用筛子在新场景中再次找到瓶子。然后RANSAC进行瓶子检测,并将瓶子从图像中剪掉


然后我会尝试使用梯度特征来找到液位的边缘。最后,您可以使用(液体边缘-底部)/(顶部瓶-底部瓶)计算百分比

识别酒瓶标签应该不难做到——它甚至可以“随时可用”,而且价格便宜(实际上可以在他们的网站上使用它来识别酒瓶标签):

关于液位,这可能是AWS无法立即解决的问题-b