Machine learning 使用Tensorflow对象检测API作为平面图像识别器的最快方法是什么?

Machine learning 使用Tensorflow对象检测API作为平面图像识别器的最快方法是什么?,machine-learning,tensorflow,computer-vision,template-matching,Machine Learning,Tensorflow,Computer Vision,Template Matching,我是计算机视觉新手,但我正在尝试编写一个android/ios应用程序,该应用程序具有以下功能: 获取实时摄像头预览,并尝试检测其中的一个平面图像(徽标或绘画)。实时的。如果找到,在徽标周围画一个矩形。如果没有匹配项,则不要绘制矩形 我发现Tensorflow对象检测API是一个很好的起点。刚刚宣布支持将TensorFlow模型导入Core ML 我学习了很多教程来训练我自己的物体检测器。训练数据是关键。我找到了一个很好的图书馆。我已经创建了数百种不同的图像源(旋转、倾斜等…)。 但它失败了!这

我是计算机视觉新手,但我正在尝试编写一个android/ios应用程序,该应用程序具有以下功能:

获取实时摄像头预览,并尝试检测其中的一个平面图像(徽标或绘画)。实时的。如果找到,在徽标周围画一个矩形。如果没有匹配项,则不要绘制矩形

我发现Tensorflow对象检测API是一个很好的起点。刚刚宣布支持将TensorFlow模型导入Core ML

我学习了很多教程来训练我自己的物体检测器。训练数据是关键。我找到了一个很好的图书馆。我已经创建了数百种不同的图像源(旋转、倾斜等…)。 但它失败了!这个数据集可能适合图像分类(我的图像全屏显示),但不适合上下文(房间)

我认为迁移学习是关键,在我的例子中,我使用了ssd_mobilenet_v1_coco模型作为基础。我试图用图片来伪造我的增强图像的背景,但没有成功

我的可用解决方案是什么?我是否正确地处理了这个问题?我需要尽快进行模特训练

I think transfer-learning is the key, In my case, I used the ssd_mobilenet_v1_coco model as a base. I tried to fake the context of my augmented image with the Random Erasing Data Augmentation technique without success.
我可以使用一些数据集进行室内外图像分类,并将我的图像随机放在上面吗?这些观点有多重要

谢谢大家!

I have created hundreds of variation of my image source (rotation, skew etc ...). But it has failed! 
这意味着你的模型没有收敛,或者最终的性能很差?如果您的模型没有收敛,则添加更多数据。“百份样本”很少。因此,使用更多的图像,制作更多的样本,并尽可能分散样本

I think transfer-learning is the key, In my case, I used the ssd_mobilenet_v1_coco model as a base. I tried to fake the context of my augmented image with the Random Erasing Data Augmentation technique without success.
你是说微调。您是否将标签减少到2(您的图像和背景)并进行了微调。如果你没有那么你肯定失败了。哦,伙计,你至少应该给我看看你的模型定义

What are my available solutions? Do I tackle the problem rightly? I need to make the model training as fast as possible.
为了使训练更快收敛,只需添加更多GPU并在多个GPU上训练即可。如果你没有钱,在Azure上租一些GPU集群。相信我,没那么贵

希望能有所帮助