Nlp 特征向量构建分类器，检测主观性_Nlp_Text Mining_Sentiment Analysis

Nlp 特征向量构建分类器，检测主观性

nlp

Nlp 特征向量构建分类器，检测主观性,nlp,text-mining,sentiment-analysis,Nlp,Text Mining,Sentiment Analysis,我试图建立一个分类器来检测主观性。我有带有主观和客观标记的文本文件。我对从这些数据中创建特征的概念几乎一无所知。我找到了主客观标签的词汇。我可以做的一件事是创建一个功能，让单词出现在各自的字典中。可能是主客观词典中的词数。之后，我打算使用朴素贝叶斯或支持向量机来开发模型我的问题如下我的方法正确吗我可以创建更多功能吗？如果可能的话，建议一些或指向我一些文件或链接我可以做一些测试，比如chi-sq等，从字典中识别有效单词吗你基本上在正确的轨道上。在做任何其他事情之前，我会尝试用你们已经拥有

我试图建立一个分类器来检测主观性。我有带有主观和客观标记的文本文件。我对从这些数据中创建特征的概念几乎一无所知。我找到了主客观标签的词汇。我可以做的一件事是创建一个功能，让单词出现在各自的字典中。可能是主客观词典中的词数。之后，我打算使用朴素贝叶斯或支持向量机来开发模型

我的问题如下

我的方法正确吗

我可以创建更多功能吗？如果可能的话，建议一些或指向我一些文件或链接

我可以做一些测试，比如chi-sq等，从字典中识别有效单词吗

你基本上在正确的轨道上。在做任何其他事情之前，我会尝试用你们已经拥有的特性应用分类器，看看它的工作情况如何

事实上，改进你的工作最好的方法是在谷歌上搜索主观分类论文并阅读它们（有很多）。例如，列出了此任务的典型功能

是的，卡方可以用于构建文本分类词典（其他常用的方法有TD*IDF、逐点互信息和LDA）

此外，最近新的基于神经网络的文本分类方法，如和展示了情绪分析的最新结果，因此它们可能也适用于主观性分类。

感谢@denis为我提供了正确的资源并确认了该方法。这对我有很大帮助