Statistics 未经培训的情绪分析,需要帮助统计情绪变化

Statistics 未经培训的情绪分析,需要帮助统计情绪变化,statistics,sentiment-analysis,Statistics,Sentiment Analysis,这个问题可能很模糊,但我会尽量用最好的语言来表达 所以我提出了一个粗略的算法来计算一个句子(评论片段的一部分)是肯定的、否定的还是中性的(让我们把这个句子称为EQ)。所以对于5个句子,我有一些基于[-100100]的句子评级。审查必须以[0,5]为基础进行评级 (0,39.88) (1, 73.07) (2, 69.65) (3, 51.43) (4,76.74) 我所面临的选择是,我现在应该选择什么方法来计算评论片段的总体评分 我做了一些研究,尝试了两种选择 1) 50%百分位数:对于以上数据

这个问题可能很模糊,但我会尽量用最好的语言来表达

所以我提出了一个粗略的算法来计算一个句子(评论片段的一部分)是肯定的、否定的还是中性的(让我们把这个句子称为EQ)。所以对于5个句子,我有一些基于[-100100]的句子评级。审查必须以[0,5]为基础进行评级

(0,39.88) (1, 73.07) (2, 69.65) (3, 51.43) (4,76.74)

我所面临的选择是,我现在应该选择什么方法来计算评论片段的总体评分

我做了一些研究,尝试了两种选择

1) 50%百分位数:对于以上数据点,我得到它为70。因此,在0-5的比例上映射,结果是4.2。结果是好的,但令人遗憾的是,百分位数并没有捕捉到EQ在片段中从一个句子到另一个句子的变化(因为它对排序数据起作用,所以这种变化会丢失)。 2) 拉格朗日多项式:这里接近69。但这种方法的问题是,我经常计算X范围的中间值(在本例中为2),因此这也不会捕获句子EQ的变化(此处终点无关紧要,它通常会给出中间值)

如果有任何想法,我应该选择什么样的方法来捕捉片段中的情商变化,并给出一个适当的值,用于获得整体情绪


可能类似excel绘制的趋势线,可以使用的概率???

如果您对未经培训/无监督的情绪分析感兴趣,请阅读Peter Turney的这篇经典论文,该论文使用无监督的方法实现了75%左右的准确率-


情绪分析很有趣