Dictionary 情绪分析的种子数据

Dictionary 情绪分析的种子数据,dictionary,sentiment-analysis,Dictionary,Sentiment Analysis,我在玩情绪分析,我在寻找一些种子数据。附近有免费的字典吗 它可以非常简单:3组文本/句子,代表“积极”、“消极”、“中性”。它不必很大 最终,我可能会为我的特定用例生成我自己的种子数据,但在我构建这个东西的过程中,如果现在有一些东西可以使用,那就太好了。来自UIC的一些数据集: 来自康奈尔大学的还有更多。如果你对情感词典感兴趣,许多作者已经介绍了基于手动构建列表的工作,以及其他半自动的方法来获取自以为是术语列表。一个很好的方法是从数据库中派生出来,通过使用同义词等关系扩展肯定/否定词的核

我在玩情绪分析,我在寻找一些种子数据。附近有免费的字典吗

它可以非常简单:3组文本/句子,代表“积极”、“消极”、“中性”。它不必很大

最终,我可能会为我的特定用例生成我自己的种子数据,但在我构建这个东西的过程中,如果现在有一些东西可以使用,那就太好了。

来自UIC的一些数据集:


来自康奈尔大学的还有更多。

如果你对情感词典感兴趣,许多作者已经介绍了基于手动构建列表的工作,以及其他半自动的方法来获取自以为是术语列表。一个很好的方法是从数据库中派生出来,通过使用同义词等关系扩展肯定/否定词的核心

手动构建列表的一个好例子是

对于导出列表的半自动方法,请查看Esuli和Sebastiani

我相信这些资源通常可用于研究,但您可能需要与作者联系,了解如何将这些资源用于非研究目的


B.

您可以在此处使用AFINN单词列表:

AFINN是一个英文单词列表,其配价为整数 在负五(负)和正五(正)之间。这些词有 2009年至2011年,由FinnÅrup Nielsen手动标记。文件是 制表符分开。有两个版本:

AFINN-111:最新版本,包含2477个单词和短语

AFINN-96:1480行中1468个独特的单词和短语。请注意 是1480行,因为有些单词列出了两次。单词列表中没有 完全按字母顺序排列


我维护了一份用于情感分析的语料库和单词列表(我的AFINN就是其中之一):


康奈尔大学的数据似乎会起作用。谢谢我有Bing Lui和Minqing Hu的数据集(来自amazon.com上大约9个产品的大约7000条评论),我把它们放在一张Excel表格上,每个产品的综合平均得分。我还添加了来自web的3种不同的免费情感分析API(ViralHeat、AlchemyAPI、repustate API)的分数,如果你想要Excel表格,我可以给你。@SherifMaherEaid:你如何从文章中创建自己的词典?@user123可能他对不同评论中使用的单词和短语进行了分类,这可能很好,坏的或中性的。+1谢谢你问这个问题:)+1谢谢AFINN有分数的单词数据库。