Machine learning 如何手工进行多标签分类?

Machine learning 如何手工进行多标签分类?,machine-learning,classification,mahout,document-classification,Machine Learning,Classification,Mahout,Document Classification,我有一个庞大的数据集,想做一个多标签分类,每个对象可以分配到多个类。我在ApacheMahout中使用了一个朴素的Bayer分类器来实现这一点。然而,它不是为多标签分类而设计的,只是将概率最高的类别分配给每个对象。如何将此分类器扩展到我的场景 我考虑的一个解决方案是设置一个阈值,并分配概率大于阈值的类。但要找到阈值并不容易,因此它不起作用。我想知道是否有人有任何想法?您需要为每个类训练一个二进制分类器。列车组应包含目标类数据和其他与目标类不匹配的任意数据

我有一个庞大的数据集,想做一个多标签分类,每个对象可以分配到多个类。我在ApacheMahout中使用了一个朴素的Bayer分类器来实现这一点。然而,它不是为多标签分类而设计的,只是将概率最高的类别分配给每个对象。如何将此分类器扩展到我的场景


我考虑的一个解决方案是设置一个阈值,并分配概率大于阈值的类。但要找到阈值并不容易,因此它不起作用。我想知道是否有人有任何想法?

您需要为每个类训练一个二进制分类器。列车组应包含目标类数据和其他与目标类不匹配的任意数据