Machine learning 二元分类_Machine Learning_Classification_Keras_Training Data

Machine learning 二元分类

machine-learning keras

Machine learning 二元分类,machine-learning,classification,keras,training-data,Machine Learning,Classification,Keras,Training Data,我目前正试图利用卫星图像识别苹果园。我面临的一个小问题是每个班级代表性数据的数量事实上，我的问题是：在我的“非苹果”类中，是否有可能在每个时代随机拍摄一些不同的图像，因为我有更多的论文（与“苹果”类相比），我希望增加网络将不具有代表性的图像分类的概率提前感谢您的帮助，这在Keras中是不可能的。默认情况下，Keras将洗牌您的训练数据，然后以小批量方式进行训练。但是，仍然有一些方法可以重新平衡数据集您面临的训练数据不平衡问题非常常见。你有很多选择；我列举了以下几点：您可以使用model

我目前正试图利用卫星图像识别苹果园。我面临的一个小问题是每个班级代表性数据的数量

事实上，我的问题是：

在我的“非苹果”类中，是否有可能在每个时代随机拍摄一些不同的图像，因为我有更多的论文（与“苹果”类相比），我希望增加网络将不具有代表性的图像分类的概率

提前感谢您的帮助

，这在Keras中是不可能的。默认情况下，Keras将洗牌您的训练数据，然后以小批量方式进行训练。但是，仍然有一些方法可以重新平衡数据集

您面临的训练数据不平衡问题非常常见。你有很多选择；我列举了以下几点：

您可以使用

model.fit（）

函数的

class\u weight

关键字调整类的相对权重

您可以“向上采样”您的“苹果”类或“向下采样”您的“非苹果”类，以便在培训期间两个类的数量相等

您可以生成“apples”类的合成图像以扩充数据集。为此，Keras中的类可能特别有用。这是对其用法的一个很好的介绍根据我的经验，我发现2和3是最有用的#1受到这样一个事实的限制，即当使用两个数量级不同的类权重和较小的批量时，随机梯度下降的收敛会受到影响

杰森·布朗利（Jason Brownlee）已经将这些信息整合在一起，可能对您也很有用。

谢谢！我将扩充我的苹果数据集，这似乎是个好计划：）