Twitter 基于朴素贝叶斯的社交媒体情感分析

Twitter 基于朴素贝叶斯的社交媒体情感分析,twitter,classification,sentiment-analysis,Twitter,Classification,Sentiment Analysis,我正在尝试使用朴素贝叶斯分类对Google+帖子进行情感分析 我一直在寻找一个数据集,我找到的唯一一个数据集是为twitter制作的。google+帖子和tweet有很多共同点,但可能不是长度我想知道这是否会改变NB分类。 同样,NaiveBayes也考虑了微笑,但是假设我们想在文本中给他们更多的权重(因为他们明确地表达了推特的情感)。使用朴素贝叶斯有什么方法可以做到这一点吗?假设你是在“帖子”级别上做的,较短的帖子可能更容易学习和分类,因为它们在表达观点方面更为直截了当,但找到答案的唯一方法是

我正在尝试使用朴素贝叶斯分类对Google+帖子进行情感分析

我一直在寻找一个数据集,我找到的唯一一个数据集是为twitter制作的。google+帖子和tweet有很多共同点,但可能不是长度我想知道这是否会改变NB分类。


同样,NaiveBayes也考虑了微笑,但是假设我们想在文本中给他们更多的权重(因为他们明确地表达了推特的情感)。使用朴素贝叶斯有什么方法可以做到这一点吗?

假设你是在“帖子”级别上做的,较短的帖子可能更容易学习和分类,因为它们在表达观点方面更为直截了当,但找到答案的唯一方法是做实验,可能使用相同的功能集和不同的功能集。对于表情符号的权重,如果它们确实是明确的或比其他特征更具“决定性”的,假设表情符号是其中一个特征,则通过假设其为真的条件概率的学习来反映。您可能还希望尝试逻辑回归和支持向量机,因为它们往往比nb提供更好的结果。在情绪分析中,你只是想把它分为两类——积极的情绪和消极的情绪,还是你也想给它打分?例如:高度消极情绪为-0.8,中度积极情绪为0.5?此外,推特文本较短,每条推特只能给出一个情绪(除了少数几个),但在google+帖子中,单个帖子可以包含情绪的混合,包括正面和负面,甚至事实。你是在做句子级分类还是职位级分类?