Machine learning 无标签的深度学习分类_Machine Learning_Keras_Deep Learning_Classification_Unsupervised Learning

Machine learning 无标签的深度学习分类

machine-learning keras deep-learning

Machine learning 无标签的深度学习分类,machine-learning,keras,deep-learning,classification,unsupervised-learning,Machine Learning,Keras,Deep Learning,Classification,Unsupervised Learning,我必须参加一个关于分类的深度学习应用的研究项目。我有一个巨大的数据集，包含35000多个特征——这些都是从实验室获得的很好的值我的想法是，我应该创建一个分类器，在给定一个新输入的情况下，该分类器必须判断数据是否良好。我必须使用keras和tensor flow的深度学习问题是这些数据没有分类。我将输入一个新列，1表示良好，0表示不良。问题是，考虑到整个训练集都是好的，我怎样才能知道一个条目是否是坏的我曾想过生成一些垃圾数据，但我不知道这是否是一个好主意-我甚至不知道如何生成它。你有什么建议

我必须参加一个关于分类的深度学习应用的研究项目。我有一个巨大的数据集，包含35000多个特征——这些都是从实验室获得的很好的值

我的想法是，我应该创建一个分类器，在给定一个新输入的情况下，该分类器必须判断数据是否良好。我必须使用keras和tensor flow的深度学习

问题是这些数据没有分类。我将输入一个新列，1表示良好，0表示不良。问题是，考虑到整个训练集都是好的，我怎样才能知道一个条目是否是坏的

我曾想过生成一些垃圾数据，但我不知道这是否是一个好主意-我甚至不知道如何生成它。你有什么建议吗

我将从anamoly检测开始。您可以首先使用f.e.（堆叠）自动编码器减少特征，然后使用sklearn中的局部异常值因子：

您首先需要减少功能的原因是，因为您的LOF将更加稳定。

谢谢您的回答，我将对此进行研究。但数据集中没有异常，没有“坏”数据可以用于培训。如果你想这样看，它是一个不完整的数据集。我想用坏数据“完成”它，这样它就能区分好坏，但我不知道这是否是个好主意。你不需要在LOFT中指定坏的例子。这是算法的要点，它对正态数据的分布进行建模（想想RBF），然后你可以检查一个新的点是否符合分布。