Tensorflow 对于一个卷积神经网络,它需要180x180像素的输入图像,我应该举多少个训练例子?

Tensorflow 对于一个卷积神经网络,它需要180x180像素的输入图像,我应该举多少个训练例子?,tensorflow,machine-learning,computer-vision,conv-neural-network,Tensorflow,Machine Learning,Computer Vision,Conv Neural Network,我正在为人脸识别(特别是我的脸)建立一个CNN。我会将图像的大小调整到180x180像素左右。为了得到好的结果,我的数据集中应该有多少图像?对于正常的神经网络,我知道特征的数量应该少于数据集,以防止过度拟合,但是对于CNN也是这样吗 我要做的只是将我的图像分类为“mypic”,将其他人的图像分类为“其他人”。关于“多少数据足够?”的问题实际上是一个相当复杂的问题,简单的回答是,它因情况而异。例如,如果您正在使用CNN来确定照片中是否存在一系列颜色,您很可能不需要大量数据。另一方面,如果你使用CN

我正在为人脸识别(特别是我的脸)建立一个CNN。我会将图像的大小调整到180x180像素左右。为了得到好的结果,我的数据集中应该有多少图像?对于正常的神经网络,我知道特征的数量应该少于数据集,以防止过度拟合,但是对于CNN也是这样吗

我要做的只是将我的图像分类为“mypic”,将其他人的图像分类为“其他人”。

关于“多少数据足够?”的问题实际上是一个相当复杂的问题,简单的回答是,它因情况而异。例如,如果您正在使用CNN来确定照片中是否存在一系列颜色,您很可能不需要大量数据。另一方面,如果你使用CNN尝试在图像中识别不同种类的鸟类,你可能需要很多例子

问题很好地概括了这一点,但TL;博士,你应该得到尽可能多的数据,并通过你选择的任何误差度量来测量你得到的误差

如果添加更多数据会减少测试集的错误,或者训练错误明显低于测试错误,那么添加更多数据以进一步减少测试集错误可能是一个好主意。但是,如果您的测试错误保持不变,或者更糟,则在添加更多示例时会增加,这可能是过度拟合的症状,因此您有太多的示例。我希望这个解释有意义,如果你对此有任何疑问,请在下面留下评论


编辑:另一个注意事项是,您应该提供数据,其中包含您希望识别人脸的任意位置。例如,如果您只想让它每次都在相同的灯光/背景下识别您的脸,那么您可能不需要太多数据,但您应该从该角度提供大部分图片数据,以便相机看到的内容与数据之间具有高度的相似性。或者,如果您想从手机上进行面部识别,例如,可以有许多不同的角度/背景,因此您应该提供更多的示例,所有示例都包含这些角度/背景的各种/组合,以获得最佳效果。

为了获得好的结果,我的数据集中应该有多少图像

实际上这个问题太笼统了,我可以给出两个答案。根据Python中TensorFlow的脚本,至少需要20个图像作为输入

if len(file_list) < 20:
  tf.logging.warning(
      'WARNING: Folder has less than 20 images, which may cause issues.')
elif len(file_list) > MAX_NUM_IMAGES_PER_CLASS:
  tf.logging.warning(
      'WARNING: Folder {} has more than {} images. Some images will '
      'never be selected.'.format(dir_name, MAX_NUM_IMAGES_PER_CLASS))
如果len(文件列表)<20:
tf.logging.warning(
“警告:文件夹中的图像少于20个,这可能会导致问题。”)
elif len(文件列表)>每个类的最大图像数:
tf.logging.warning(
'警告:文件夹{}有超过{}个图像。某些图像将被删除'
“永远不要选择。”。格式(目录名称、每个类的最大图像数))
最好提供比建议数量更多的输入图像,因为输入的数据越多,训练和推断数据的准确性就越高。既然你只是想根据你的面部图像进行检测,那么我敢打赌这是如此的简单,你可以经常从你的照片和自拍中收集它

但好的结果不仅仅取决于图像的数量。某些用户对资源的访问可能有限。好的结果还取决于您使用的CNN架构。不同的体系结构或培训模式肯定会产生不同类型的好结果。有很多模型或架构,比如MobileNet和ResNet,都有利于CNN的深度学习


无论您希望进行何种类型的检测,在这种情况下,请确保您已经将这些图像分类到各自的文件夹中。

我认为这个问题太广泛了。首先,你需要很好地理解深度学习的概念。有很多来源。