Tensorflow 如何在没有大量标记数据的情况下训练神经网络

Tensorflow 如何在没有大量标记数据的情况下训练神经网络,tensorflow,deep-learning,object-detection,autoencoder,Tensorflow,Deep Learning,Object Detection,Autoencoder,我是机器学习新手,我正在尝试建立一个目标检测神经网络 我有3000张图片,但只有150张贴了标签。 我的图像由web ui页面组成,我在其中标记按钮和徽标 目前,我已经尝试使用更快的rcnn\U inception\U resnet\U v2\u coco模型对其进行训练,但效果并不理想。 这些功能可以找到,但并不完美。 有没有办法改善结果?也许换个模特 如果我使用一个自动编码器对所有3000幅图像进行无监督的训练,然后使用转移学习到带有标记数据的深度学习模型中,我会得到更好的结果吗?如果是这

我是机器学习新手,我正在尝试建立一个目标检测神经网络

我有3000张图片,但只有150张贴了标签。 我的图像由web ui页面组成,我在其中标记按钮和徽标

目前,我已经尝试使用更快的rcnn\U inception\U resnet\U v2\u coco模型对其进行训练,但效果并不理想。 这些功能可以找到,但并不完美。

有没有办法改善结果?也许换个模特

如果我使用一个自动编码器对所有3000幅图像进行无监督的训练,然后使用转移学习到带有标记数据的深度学习模型中,我会得到更好的结果吗?如果是这样,我如何使用python和tensorflow实现它


谢谢

首先,查看COCO和VOC数据集

如果他们的类与您的类非常相似,那么您可以使用预先训练的模型(deeplab、yolo、maskrnn等)并在您的数据集上进行训练,性能应该非常好。以下是一些要签入github的存储库:

如果您的数据集与这些数据集非常不同,那么您可能不会期望有好的性能。在这种情况下,您必须通过更改类的数量来重新设计网络。您可以使用数据增强(自动编码器可能不是数据生成的最佳选择,因为生成高质量图像很复杂)。这是一个很好的数据扩充库,它使用掩码扩充样本


您可以使用。这就是使用更快的\u rcnn\u inception\u resnet\u v2\u coco模型得出这些结果的原因,您认为我应该使用哪种模型?谢谢您的回答!实际上,对于自动编码器,我没有考虑生成数据,而是在3000个未标记的图像上训练第一个NN,然后在另一个NN的低部分使用标记数据进行加权(一个预训练过程),这样权重就已经训练好了,可以看到特定类型的模式,你认为呢?是的,理论上是可行的,但会花费你大量的时间来生成高质量的图像,使用简单的增强会更容易。好吧,那么使用更轻的CNN呢?我已经读到,较小的NN用于较小的数据集,显然您可以,但很可能您会失望。因此,您完全可以尝试观察生成的图像是否适合您的任务。