Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/tfs/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Twitter 运行情绪分析前的预处理_Twitter_Sentiment Analysis - Fatal编程技术网

Twitter 运行情绪分析前的预处理

Twitter 运行情绪分析前的预处理,twitter,sentiment-analysis,Twitter,Sentiment Analysis,情绪分析有助于我们衡量推特的情绪,然而,我们从api中获得的许多推特可能真的无法“分类”为某种情绪 是否有人知道有任何api/文献在推特上运行任何类型的分类器(例如,remove#,remove@name等)之前谈论对推特进行预处理 此外,如果我想确定在我开始对推特运行情绪分析器之前,在推特上运行情绪分析(比如电影评论)是否有意义,我可以查找哪些主题/api/文献?也许你应该阅读: 作者:包燕薇、全长琴、王丽娟、任福吉 作者:I.Hemalatha、G.P.Saradhi Varma和A.Go

情绪分析有助于我们衡量推特的情绪,然而,我们从api中获得的许多推特可能真的无法“分类”为某种情绪

是否有人知道有任何api/文献在推特上运行任何类型的分类器(例如,remove#,remove@name等)之前谈论对推特进行预处理

此外,如果我想确定在我开始对推特运行情绪分析器之前,在推特上运行情绪分析(比如电影评论)是否有意义,我可以查找哪些主题/api/文献?

也许你应该阅读:

  • 作者:包燕薇、全长琴、王丽娟、任福吉
  • 作者:I.Hemalatha、G.P.Saradhi Varma和A.Govardhan

(然后在Python中,
tweet=re.sub(旧模式、新模式、tweet)
用于执行每次修改。)

我使用TextBlob库对数据集进行分类

TextBlob是一个用于处理文本数据的Python(2和3)库。它提供了一个简单的API,用于深入研究常见的自然语言处理(NLP)任务,如词性标记、名词短语提取、情感分析、分类、翻译等

功能: -名词短语抽取 -词性标注 -情绪分析 -分类(朴素贝叶斯、决策树) -Google Translate支持的语言翻译和检测 -标记化(将文本拆分为单词和句子) -单词和短语频率 -解析 -n克 -词形变化(复数化和单数化)和柠檬化 -拼写更正 -通过扩展添加新的模型或语言 -WordNet集成

立即获取它:

$pip安装-U textblob

$python-m textblob.download_corpora

参考:


***我不能告诉你结果,因为这是我论文的一部分,我还在写。

事实上,你最好自己做这件肮脏的工作。正则表达式很容易删除#、@或url。标点符号和表情符号对于情绪分析非常重要。我建议使用CMU NLP group()训练的语音标记来表达这些字符

对于单词包和tf idf分数等基本功能,我想使用Scikit-learn()。
对于单字情感,您可以使用斯坦福Nlp情感分析。(

@N.M.对不起,第一个链接指向了错误的论文。我刚刚纠正了它,但访问不是免费的。