Python 改进神经网络区分红蓝的方法?

Python 改进神经网络区分红蓝的方法?,python,tensorflow,machine-learning,scikit-learn,deep-learning,Python,Tensorflow,Machine Learning,Scikit Learn,Deep Learning,我有很多关于红色和蓝色的数据,我试图区分红色数据和蓝色数据,但它们基本上都是这样的(参见Imgur)。重叠很多,但在不同的地方达到峰值 它们重叠很多,我只能得到roc auc分数0.65 到目前为止,在数据处理方面,我只使用了类权重来平衡它。我尝试过不同类型的密集/辍学网络,具有不同的功能,但只有0.65是我能得到的最好的,大多数徘徊在0.63-0.65左右,无论我添加了多少层或年代 例如,一个简单的DNN/辍学率为0.65: Dense(512, activation='relu')

我有很多关于红色和蓝色的数据,我试图区分红色数据和蓝色数据,但它们基本上都是这样的(参见Imgur)。重叠很多,但在不同的地方达到峰值

它们重叠很多,我只能得到roc auc分数0.65

到目前为止,在数据处理方面,我只使用了类权重来平衡它。我尝试过不同类型的密集/辍学网络,具有不同的功能,但只有0.65是我能得到的最好的,大多数徘徊在0.63-0.65左右,无论我添加了多少层或年代

例如,一个简单的DNN/辍学率为0.65:

    Dense(512, activation='relu'),
    Dropout(0.3),
    Dense(512, activation='relu'),
    Dropout(0.3),
    Dense(512, activation='relu'),
    Dropout(0.3),
    Dense(512, activation='relu'),
    Dropout(0.3),
    Dense(512, activation='relu'),
    Dense(1, activation="sigmoid")
我在网上找到的一些resnet修改也只提供了0.65

到目前为止,我只尝试了CNN和密集层网络


我可以尝试哪种方法让神经网络更清楚地区分红色和蓝色?

根据您的描述,不清楚您为什么认为应该有更好的分数。您不应更改模型,而应关注功能。基于红色和蓝色代表什么,你为什么认为它们不同?在您尝试估计分类器的参数之前,您是否可以使用这些特性讲述这个故事

<>你也应该考虑结果的应用。在某些情况下,分数为0.5是令人难以置信的,而在其他应用程序中,任何低于0.9999的分数都是绝对失败的


根据我的经验,展示一个模型,即使它看起来做得非常出色,如果没有一个清晰的故事,充其量也会遭到怀疑。最坏的情况是,这会影响演讲者的可信度。

可能更适合我投票结束这个问题,因为这不是关于ML方法和实践中定义的编程。如果你得到0.5分,这与扔硬币一样,基本上一文不值。这不一定是真的。如果我能以50%的成功率挑选一年内价值翻了一番的股票,我会在海滩上。