Machine learning 无标签的深度学习分类

Machine learning 无标签的深度学习分类,machine-learning,keras,deep-learning,classification,unsupervised-learning,Machine Learning,Keras,Deep Learning,Classification,Unsupervised Learning,我必须参加一个关于分类的深度学习应用的研究项目。我有一个巨大的数据集,包含35000多个特征——这些都是从实验室获得的很好的值 我的想法是,我应该创建一个分类器,在给定一个新输入的情况下,该分类器必须判断数据是否良好。我必须使用keras和tensor flow的深度学习 问题是这些数据没有分类。我将输入一个新列,1表示良好,0表示不良。问题是,考虑到整个训练集都是好的,我怎样才能知道一个条目是否是坏的 我曾想过生成一些垃圾数据,但我不知道这是否是一个好主意-我甚至不知道如何生成它。你有什么建议

我必须参加一个关于分类的深度学习应用的研究项目。我有一个巨大的数据集,包含35000多个特征——这些都是从实验室获得的很好的值

我的想法是,我应该创建一个分类器,在给定一个新输入的情况下,该分类器必须判断数据是否良好。我必须使用keras和tensor flow的深度学习

问题是这些数据没有分类。我将输入一个新列,1表示良好,0表示不良。问题是,考虑到整个训练集都是好的,我怎样才能知道一个条目是否是坏的


我曾想过生成一些垃圾数据,但我不知道这是否是一个好主意-我甚至不知道如何生成它。你有什么建议吗

我将从anamoly检测开始。您可以首先使用f.e.(堆叠)自动编码器减少特征,然后使用sklearn中的局部异常值因子:


您首先需要减少功能的原因是,因为您的LOF将更加稳定。

谢谢您的回答,我将对此进行研究。但数据集中没有异常,没有“坏”数据可以用于培训。如果你想这样看,它是一个不完整的数据集。我想用坏数据“完成”它,这样它就能区分好坏,但我不知道这是否是个好主意。你不需要在LOFT中指定坏的例子。这是算法的要点,它对正态数据的分布进行建模(想想RBF),然后你可以检查一个新的点是否符合分布。