Machine learning 二元分类

Machine learning 二元分类,machine-learning,classification,keras,training-data,Machine Learning,Classification,Keras,Training Data,我目前正试图利用卫星图像识别苹果园。我面临的一个小问题是每个班级代表性数据的数量 事实上,我的问题是: 在我的“非苹果”类中,是否有可能在每个时代随机拍摄一些不同的图像,因为我有更多的论文(与“苹果”类相比),我希望增加网络将不具有代表性的图像分类的概率 提前感谢您的帮助,这在Keras中是不可能的。默认情况下,Keras将洗牌您的训练数据,然后以小批量方式进行训练。但是,仍然有一些方法可以重新平衡数据集 您面临的训练数据不平衡问题非常常见。你有很多选择;我列举了以下几点: 您可以使用model

我目前正试图利用卫星图像识别苹果园。我面临的一个小问题是每个班级代表性数据的数量

事实上,我的问题是:

在我的“非苹果”类中,是否有可能在每个时代随机拍摄一些不同的图像,因为我有更多的论文(与“苹果”类相比),我希望增加网络将不具有代表性的图像分类的概率


提前感谢您的帮助

,这在Keras中是不可能的。默认情况下,Keras将洗牌您的训练数据,然后以小批量方式进行训练。但是,仍然有一些方法可以重新平衡数据集

您面临的训练数据不平衡问题非常常见。你有很多选择;我列举了以下几点:

  • 您可以使用
    model.fit()
    函数的
    class\u weight
    关键字调整类的相对权重
  • 您可以“向上采样”您的“苹果”类或“向下采样”您的“非苹果”类,以便在培训期间两个类的数量相等
  • 您可以生成“apples”类的合成图像以扩充数据集。为此,Keras中的类可能特别有用。这是对其用法的一个很好的介绍 根据我的经验,我发现2和3是最有用的#1受到这样一个事实的限制,即当使用两个数量级不同的类权重和较小的批量时,随机梯度下降的收敛会受到影响


    杰森·布朗利(Jason Brownlee)已经将这些信息整合在一起,可能对您也很有用。

    谢谢!我将扩充我的苹果数据集,这似乎是个好计划:)