Twitter 运行情绪分析前的预处理
情绪分析有助于我们衡量推特的情绪,然而,我们从api中获得的许多推特可能真的无法“分类”为某种情绪 是否有人知道有任何api/文献在推特上运行任何类型的分类器(例如,remove#,remove@name等)之前谈论对推特进行预处理 此外,如果我想确定在我开始对推特运行情绪分析器之前,在推特上运行情绪分析(比如电影评论)是否有意义,我可以查找哪些主题/api/文献?也许你应该阅读:Twitter 运行情绪分析前的预处理,twitter,sentiment-analysis,Twitter,Sentiment Analysis,情绪分析有助于我们衡量推特的情绪,然而,我们从api中获得的许多推特可能真的无法“分类”为某种情绪 是否有人知道有任何api/文献在推特上运行任何类型的分类器(例如,remove#,remove@name等)之前谈论对推特进行预处理 此外,如果我想确定在我开始对推特运行情绪分析器之前,在推特上运行情绪分析(比如电影评论)是否有意义,我可以查找哪些主题/api/文献?也许你应该阅读: 作者:包燕薇、全长琴、王丽娟、任福吉 作者:I.Hemalatha、G.P.Saradhi Varma和A.Go
- 作者:包燕薇、全长琴、王丽娟、任福吉
- 作者:I.Hemalatha、G.P.Saradhi Varma和A.Govardhan
(然后在Python中,
tweet=re.sub(旧模式、新模式、tweet)
用于执行每次修改。)我使用TextBlob库对数据集进行分类
TextBlob是一个用于处理文本数据的Python(2和3)库。它提供了一个简单的API,用于深入研究常见的自然语言处理(NLP)任务,如词性标记、名词短语提取、情感分析、分类、翻译等
功能:
-名词短语抽取
-词性标注
-情绪分析
-分类(朴素贝叶斯、决策树)
-Google Translate支持的语言翻译和检测
-标记化(将文本拆分为单词和句子)
-单词和短语频率
-解析
-n克
-词形变化(复数化和单数化)和柠檬化
-拼写更正
-通过扩展添加新的模型或语言
-WordNet集成
立即获取它:
$pip安装-U textblob
$python-m textblob.download_corpora
参考:
***我不能告诉你结果,因为这是我论文的一部分,我还在写。事实上,你最好自己做这件肮脏的工作。正则表达式很容易删除#、@或url。标点符号和表情符号对于情绪分析非常重要。我建议使用CMU NLP group()训练的语音标记来表达这些字符 对于单词包和tf idf分数等基本功能,我想使用Scikit-learn()。
对于单字情感,您可以使用斯坦福Nlp情感分析。(@N.M.对不起,第一个链接指向了错误的论文。我刚刚纠正了它,但访问不是免费的。