Machine learning 堆栈溢出标签预测器…；请推荐一种机器学习方法？_Machine Learning_Prediction_Text Classification

Machine learning 堆栈溢出标签预测器…；请推荐一种机器学习方法？

machine-learning

Machine learning 堆栈溢出标签预测器…；请推荐一种机器学习方法？,machine-learning,prediction,text-classification,Machine Learning,Prediction,Text Classification,我试图预测stackoverflow问题的标签，但我无法决定哪种机器学习算法是正确的方法输入：作为一个数据集，我挖掘了stackoverflow问题，我对数据集进行了标记，并从数据中删除了停止字和标点符号我尝试过的事情： TF-IDF 在数据集上训练朴素贝叶斯，然后为预测标记提供用户定义的输入，但它不能正常工作线性支持向量机我应该使用哪种ML算法？有监督的还是无监督的？如果可能，请从头开始建议正确的ML方法。PS：我有StackOverflow上所有标签的列表，所以，这会有帮助吗？谢谢，

我试图预测stackoverflow问题的标签，但我无法决定哪种机器学习算法是正确的方法

输入：作为一个数据集，我挖掘了stackoverflow问题，我对数据集进行了标记，并从数据中删除了停止字和标点符号

我尝试过的事情：

TF-IDF

在数据集上训练朴素贝叶斯，然后为预测标记提供用户定义的输入，但它不能正常工作

线性支持向量机

我应该使用哪种ML算法？有监督的还是无监督的？如果可能，请从头开始建议正确的ML方法。PS：我有StackOverflow上所有标签的列表，所以，这会有帮助吗？谢谢，我想试试MLP。为了开始，我会选择一组相当小的关键字作为输入，并对它们进行编码[1..100例如]，然后训练一组相当小的输出标签

PS：这项任务的无监督学习通常是不利的，因为许多涉及不同标签的问题具有非常相似的内容，并且很可能聚集在一起

不可能同时获得标签，然后将集合分成两部分，用一部分进行训练，用另一部分进行验证？已经在NaiveBayes中这样做了！