Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/go/7.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Nlp 特征向量构建分类器,检测主观性_Nlp_Text Mining_Sentiment Analysis - Fatal编程技术网

Nlp 特征向量构建分类器,检测主观性

Nlp 特征向量构建分类器,检测主观性,nlp,text-mining,sentiment-analysis,Nlp,Text Mining,Sentiment Analysis,我试图建立一个分类器来检测主观性。我有带有主观和客观标记的文本文件。我对从这些数据中创建特征的概念几乎一无所知。我找到了主客观标签的词汇。我可以做的一件事是创建一个功能,让单词出现在各自的字典中。可能是主客观词典中的词数。之后,我打算使用朴素贝叶斯或支持向量机来开发模型 我的问题如下 我的方法正确吗 我可以创建更多功能吗?如果可能的话,建议一些或指向我一些文件或链接 我可以做一些测试,比如chi-sq等,从字典中识别有效单词吗 你基本上在正确的轨道上。在做任何其他事情之前,我会尝试用你们已经拥有

我试图建立一个分类器来检测主观性。我有带有主观和客观标记的文本文件。我对从这些数据中创建特征的概念几乎一无所知。我找到了主客观标签的词汇。我可以做的一件事是创建一个功能,让单词出现在各自的字典中。可能是主客观词典中的词数。之后,我打算使用朴素贝叶斯或支持向量机来开发模型

我的问题如下

  • 我的方法正确吗
  • 我可以创建更多功能吗?如果可能的话,建议一些或指向我一些文件或链接
  • 我可以做一些测试,比如chi-sq等,从字典中识别有效单词吗

  • 你基本上在正确的轨道上。在做任何其他事情之前,我会尝试用你们已经拥有的特性应用分类器,看看它的工作情况如何

    事实上,改进你的工作最好的方法是在谷歌上搜索主观分类论文并阅读它们(有很多)。例如,列出了此任务的典型功能

    是的,卡方可以用于构建文本分类词典(其他常用的方法有TD*IDF、逐点互信息和LDA)


    此外,最近新的基于神经网络的文本分类方法,如和展示了情绪分析的最新结果,因此它们可能也适用于主观性分类。

    感谢@denis为我提供了正确的资源并确认了该方法。这对我有很大帮助