Stanford nlp CoreNLP训练模型问题

Stanford nlp CoreNLP训练模型问题,stanford-nlp,sentiment-analysis,scoring,Stanford Nlp,Sentiment Analysis,Scoring,我正在使用斯坦福CoreNLP对我收集的一些推文进行情绪分析。我创建了一个模拟训练模型,其中一句话的得分如下: (0(2熊)(2(2油)(2市场))) 我的得分是0到4分,0分是非常负的,2分是中性的,4分是非常正的。 我正在测试以下两条推文: 熊市 熊市 它将第一个句子赋值为0,这是正确的,第二个句子的分数为2,这是不正确的,因为这个句子也应该是否定的。这两句话之间的唯一区别是第二句话中市场的s 我的问题是:有没有办法回避这样一个事实,即任何单词的任何变化都会导致两句话的得分不同?我认为简短的

我正在使用斯坦福CoreNLP对我收集的一些推文进行情绪分析。我创建了一个模拟训练模型,其中一句话的得分如下: (0(2熊)(2(2油)(2市场)))

我的得分是0到4分,0分是非常负的,2分是中性的,4分是非常正的。 我正在测试以下两条推文:

熊市

熊市

它将第一个句子赋值为0,这是正确的,第二个句子的分数为2,这是不正确的,因为这个句子也应该是否定的。这两句话之间的唯一区别是第二句话中市场的s


我的问题是:有没有办法回避这样一个事实,即任何单词的任何变化都会导致两句话的得分不同?

我认为简短的答案是“不”——措辞的不同总是有可能改变句子的情感。您可以尝试通过重新培训新数据来缓解问题


真的,如果你只看电影评论,你应该期望模型的性能至少会下降一点,偶尔会下降很多。如果你有训练数据,就值得重新训练。

我认为简短的回答是“不”——措辞上的差异总是有可能改变句子的情绪。您可以尝试通过重新培训新数据来缓解问题


真的,如果你只看电影评论,你应该期望模型的性能至少会下降一点,偶尔会下降很多。如果你有训练数据,就值得重新训练。

实际上,你可以通过用词根或“词干”形式替换每个单词的语言学方法来解决这个问题。你过滤每一个句子,减少每一个单词,删除复数、动词结尾、形容词词尾变化等,然后训练


你用同样的方法过滤你的输入。关于你的词汇,你仍然需要做出一些决定,比如是否将“最好”改为“好”。

事实上,你可以通过用词根或词干形式替换每个单词的语言学方法来解决这个问题。你过滤每一个句子,减少每一个单词,删除复数、动词结尾、形容词词尾变化等,然后训练

你用同样的方法过滤你的输入。关于你的词库,你仍然需要做出一些决定,比如是否将“最好的”改为“好的”