Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/wix/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Stanford nlp 斯坦福大学CoreNLP如何为短语分配括号?_Stanford Nlp_Sentiment Analysis - Fatal编程技术网

Stanford nlp 斯坦福大学CoreNLP如何为短语分配括号?

Stanford nlp 斯坦福大学CoreNLP如何为短语分配括号?,stanford-nlp,sentiment-analysis,Stanford Nlp,Sentiment Analysis,我有一个问题,关于CoreNLP如何在累积句子总分的过程中为短语分配括号。主要问题是它计算句子中短语情感的顺序。有人知道使用什么算法吗?一个例子可以清楚地说明我的问题: 在我的训练模型中,我使用的量表是0-4,其中0是负的,2是中性的,4是正的,所以下面的短语被评分:(3(1低)(2(2油)(2生产))) -注:上升至正面的原因是我们预测油价,而较低的石油产量将导致较高的价格,因此正确预测油价上涨需要整体积极情绪 接下来,让我们假设以下推文被抓获:“欧佩克决定降低石油产量”。我想CoreNLP做

我有一个问题,关于CoreNLP如何在累积句子总分的过程中为短语分配括号。主要问题是它计算句子中短语情感的顺序。有人知道使用什么算法吗?一个例子可以清楚地说明我的问题:

在我的训练模型中,我使用的量表是0-4,其中0是负的,2是中性的,4是正的,所以下面的短语被评分:(3(1低)(2(2油)(2生产))) -注:上升至正面的原因是我们预测油价,而较低的石油产量将导致较高的价格,因此正确预测油价上涨需要整体积极情绪

接下来,让我们假设以下推文被抓获:“欧佩克决定降低石油产量”。我想CoreNLP做的第一件事就是给每个单词打分。在我们的训练模式中,lower的得分为1,而所有其他单词均未得分,因此将获得中性得分

问题似乎源于CoreNLP如何决定对短语(词组)评分。如果它做的第一件事是给“石油产量”打分,然后给“较低的石油产量”打分,那么就会看到我们的模型中有一个与“较低的石油产量”精确匹配的短语,并且正确地分配了3分

然而,我猜测的是:首先CoreNLP得分“欧佩克决定”,然后“欧佩克决定”,然后“欧佩克决定减产”,然后“欧佩克决定减产”,然后欧佩克决定减产“。在这种情况下,“较低的石油产量”这一短语永远不会在真空中被考虑,因为没有与我们的培训模式相匹配的短语,单个单词的分数决定了整体情绪,并且由于“较低”,因此得到1分。”


唯一的解决办法是有人告诉我CoreNLP用来给短语打分的括号算法。谢谢你的帮助

Stanford CoreNLP对句子运行选区解析器。然后使用TreeBinarizer将选区树转换为二叉树

这是相关类别:

edu.stanford.nlp.parser.lexparser.TreeBinarizer

以下是GitHub上源代码的链接:

以下是TreeBinarizer设置位置的源代码: