Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/machine-learning/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 堆栈溢出标签预测器…;请推荐一种机器学习方法?_Machine Learning_Prediction_Text Classification - Fatal编程技术网

Machine learning 堆栈溢出标签预测器…;请推荐一种机器学习方法?

Machine learning 堆栈溢出标签预测器…;请推荐一种机器学习方法?,machine-learning,prediction,text-classification,Machine Learning,Prediction,Text Classification,我试图预测stackoverflow问题的标签,但我无法决定哪种机器学习算法是正确的方法 输入:作为一个数据集,我挖掘了stackoverflow问题,我对数据集进行了标记,并从数据中删除了停止字和标点符号 我尝试过的事情: TF-IDF 在数据集上训练朴素贝叶斯,然后为预测标记提供用户定义的输入,但它不能正常工作 线性支持向量机 我应该使用哪种ML算法?有监督的还是无监督的?如果可能,请从头开始建议正确的ML方法。PS:我有StackOverflow上所有标签的列表,所以,这会有帮助吗?谢谢,

我试图预测stackoverflow问题的标签,但我无法决定哪种机器学习算法是正确的方法

输入:作为一个数据集,我挖掘了stackoverflow问题,我对数据集进行了标记,并从数据中删除了停止字和标点符号

我尝试过的事情:

  • TF-IDF
  • 在数据集上训练朴素贝叶斯,然后为预测标记提供用户定义的输入,但它不能正常工作
  • 线性支持向量机

  • 我应该使用哪种ML算法?有监督的还是无监督的?如果可能,请从头开始建议正确的ML方法。PS:我有StackOverflow上所有标签的列表,所以,这会有帮助吗?谢谢,我想试试MLP。为了开始,我会选择一组相当小的关键字作为输入,并对它们进行编码[1..100例如],然后训练一组相当小的输出标签


    PS:这项任务的无监督学习通常是不利的,因为许多涉及不同标签的问题具有非常相似的内容,并且很可能聚集在一起

    不可能同时获得标签,然后将集合分成两部分,用一部分进行训练,用另一部分进行验证?已经在NaiveBayes中这样做了!