Machine learning 图像识别与唯一性检测_Machine Learning_Computer Vision_Artificial Intelligence

Machine learning 图像识别与唯一性检测

machine-learning computer-vision artificial-intelligence

Machine learning 图像识别与唯一性检测,machine-learning,computer-vision,artificial-intelligence,Machine Learning,Computer Vision,Artificial Intelligence,我是AI/ML新手，正在尝试使用AI/ML解决以下问题。我有一组（定制）图像，这些图像虽然具有共同特征，但也具有独特的图案/签名和颜色值。我应该使用哪一组算法以以下方式获得通行证： 1.识别共同特征（如10x10mm图像中任意位置存在三角形）。如果存在，则继续，否则退出。 2.识别唯一的图案/签名，以单独识别每个图像。图案/签名可以是形状（人眼可见或隐藏，就像使用无边界背景图像的叠加形状一样）。 3.存储色调/色调/饱和度以确定任何损失/差异（可能是因为捕获源与原始源不同）虽然这在某种程度上

我是AI/ML新手，正在尝试使用AI/ML解决以下问题。我有一组（定制）图像，这些图像虽然具有共同特征，但也具有独特的图案/签名和颜色值。我应该使用哪一组算法以以下方式获得通行证： 1.识别共同特征（如10x10mm图像中任意位置存在三角形）。如果存在，则继续，否则退出。 2.识别唯一的图案/签名，以单独识别每个图像。图案/签名可以是形状（人眼可见或隐藏，就像使用无边界背景图像的叠加形状一样）。 3.存储色调/色调/饱和度以确定任何损失/差异（可能是因为捕获源与原始源不同）

虽然这在某种程度上类似于人脸识别算法，但对我来说，饱和度/阴影在与方向无关的情况下很重要

我认为使用CNN可能是第2步的方法，SVN可能是第1步的方法，任何关于培训的意见，细节都将受到欢迎。第三步，使用BGR2HSV怎么样？目标是使用ML/AI，而不是进入机器视觉

识别共同特征（如10x10mm图像中任意位置存在三角形）。如果存在，则继续，否则退出从某种意义上说，您需要的是一个能够检测图像中模式的分类器。然而，我们可以训练分类器来检测图像中特定类型的模式

例如，我可以训练分类器识别正方形和圆形，但如果我给它显示一个包含三角形的图像，我不能期望它告诉我它是三角形，因为它以前从未见过它。缺点是，分类器最终会将其误分类为已知存在的形状之一：正方形或圆形。好处是，你可以防止这种情况

识别唯一的图案/签名，以单独识别每个图像

您要做的是在大量标记数据上训练分类器。如果希望分类器检测图像中的正方形、圆形或三角形，则必须使用大量标记的正方形、圆形和三角形图像对其进行训练

存储色调/色调/饱和度以确定任何损失/差异（可能是因为捕获源与原始源不同）
现在，你将离开简单的图像标签领域，进入计算机视觉世界。这并不像普通的图像分类器那么简单，但这是可能的，而且有很多在线工具可以帮助您做到这一点。例如，您可以查看。它们在Python和C++中有一个实现。我认为使用CNN可能是第2步和SVN的方法步骤#1
您可以将步骤1和步骤2与卷积神经网络（CNN）相结合。您不需要使用两步预测过程。然而，要小心，如果你给CNN递过一张汽车的图片，它仍然会把它标为一个形状。你可以通过训练一百万个形状的正样本和一百万个随机的其他图像的负样本来避免这个问题。这样，任何不是形状的东西都将被归类为“其他”。这是一种可能性
第三步，使用BGR2HSV怎么样？目标是使用ML/AI，而不是进入机器视觉

有了这一步，除了进入计算机视觉，别无选择。我不确定该怎么做，但我可以保证OpenCV将为您提供一种方法。事实上，使用OpenCV，您将不再需要实现自己的CNN，因为OpenCV有自己的图像标签库。
但是为什么
的目标是使用ML/AI而不是进入机器视觉。
？因为模式是随机的，从精确的角度来看，这在编程上很难实现。老实说，机器视觉（erm，计算机视觉）基本上是CNN的荣耀。@Coldspeed，所以你建议我留在CNN。与使用SVN相比，上述任何一步都会有过大的杀伤力吗？@KoushikB。我想你是说SVM。不，我认为这一点也不过分。CNNs在基于图像的ML问题上胜过支持向量机。谢谢。我们不知道OpenCV有自己的图像标签库。
关于第2步，我们的想法是找到唯一性，类似于一旦我们知道每一张脸是一张脸，就以不同的方式识别每一张脸。我试图实现的唯一缺点是，我无法使用多个样本来训练它，而只能使用一个样本。这是否意味着它超出了ML的范围，进入了计算机视觉的世界？@KoushikB。对这是一个独立的计算机视觉框架。我已经完全切换到OpenCV（首先是Java，现在完全是C++）进行所有处理。你的回答确实有助于确定方向。