Nlp 特征向量构建分类器,检测主观性
我试图建立一个分类器来检测主观性。我有带有主观和客观标记的文本文件。我对从这些数据中创建特征的概念几乎一无所知。我找到了主客观标签的词汇。我可以做的一件事是创建一个功能,让单词出现在各自的字典中。可能是主客观词典中的词数。之后,我打算使用朴素贝叶斯或支持向量机来开发模型 我的问题如下Nlp 特征向量构建分类器,检测主观性,nlp,text-mining,sentiment-analysis,Nlp,Text Mining,Sentiment Analysis,我试图建立一个分类器来检测主观性。我有带有主观和客观标记的文本文件。我对从这些数据中创建特征的概念几乎一无所知。我找到了主客观标签的词汇。我可以做的一件事是创建一个功能,让单词出现在各自的字典中。可能是主客观词典中的词数。之后,我打算使用朴素贝叶斯或支持向量机来开发模型 我的问题如下 我的方法正确吗 我可以创建更多功能吗?如果可能的话,建议一些或指向我一些文件或链接 我可以做一些测试,比如chi-sq等,从字典中识别有效单词吗 你基本上在正确的轨道上。在做任何其他事情之前,我会尝试用你们已经拥有
你基本上在正确的轨道上。在做任何其他事情之前,我会尝试用你们已经拥有的特性应用分类器,看看它的工作情况如何 事实上,改进你的工作最好的方法是在谷歌上搜索主观分类论文并阅读它们(有很多)。例如,列出了此任务的典型功能 是的,卡方可以用于构建文本分类词典(其他常用的方法有TD*IDF、逐点互信息和LDA)
此外,最近新的基于神经网络的文本分类方法,如和展示了情绪分析的最新结果,因此它们可能也适用于主观性分类。感谢@denis为我提供了正确的资源并确认了该方法。这对我有很大帮助