Python 改进神经网络区分红蓝的方法？_Python_Tensorflow_Machine Learning_Scikit Learn_Deep Learning

Python 改进神经网络区分红蓝的方法？

python tensorflow machine-learning scikit-learn deep-learning

Python 改进神经网络区分红蓝的方法？,python,tensorflow,machine-learning,scikit-learn,deep-learning,Python,Tensorflow,Machine Learning,Scikit Learn,Deep Learning,我有很多关于红色和蓝色的数据，我试图区分红色数据和蓝色数据，但它们基本上都是这样的（参见Imgur）。重叠很多，但在不同的地方达到峰值它们重叠很多，我只能得到roc auc分数0.65 到目前为止，在数据处理方面，我只使用了类权重来平衡它。我尝试过不同类型的密集/辍学网络，具有不同的功能，但只有0.65是我能得到的最好的，大多数徘徊在0.63-0.65左右，无论我添加了多少层或年代例如，一个简单的DNN/辍学率为0.65： Dense(512, activation='relu')

我有很多关于红色和蓝色的数据，我试图区分红色数据和蓝色数据，但它们基本上都是这样的（参见Imgur）。重叠很多，但在不同的地方达到峰值

它们重叠很多，我只能得到roc auc分数0.65

到目前为止，在数据处理方面，我只使用了类权重来平衡它。我尝试过不同类型的密集/辍学网络，具有不同的功能，但只有0.65是我能得到的最好的，大多数徘徊在0.63-0.65左右，无论我添加了多少层或年代

例如，一个简单的DNN/辍学率为0.65：

    Dense(512, activation='relu'),
    Dropout(0.3),
    Dense(512, activation='relu'),
    Dropout(0.3),
    Dense(512, activation='relu'),
    Dropout(0.3),
    Dense(512, activation='relu'),
    Dropout(0.3),
    Dense(512, activation='relu'),
    Dense(1, activation="sigmoid")

我在网上找到的一些resnet修改也只提供了0.65

到目前为止，我只尝试了CNN和密集层网络

我可以尝试哪种方法让神经网络更清楚地区分红色和蓝色？

根据您的描述，不清楚您为什么认为应该有更好的分数。您不应更改模型，而应关注功能。基于红色和蓝色代表什么，你为什么认为它们不同？在您尝试估计分类器的参数之前，您是否可以使用这些特性讲述这个故事

<>你也应该考虑结果的应用。在某些情况下，分数为0.5是令人难以置信的，而在其他应用程序中，任何低于0.9999的分数都是绝对失败的

根据我的经验，展示一个模型，即使它看起来做得非常出色，如果没有一个清晰的故事，充其量也会遭到怀疑。最坏的情况是，这会影响演讲者的可信度。

可能更适合我投票结束这个问题，因为这不是关于ML方法和实践中定义的编程。如果你得到0.5分，这与扔硬币一样，基本上一文不值。这不一定是真的。如果我能以50%的成功率挑选一年内价值翻了一番的股票，我会在海滩上。