Stanford nlp 如何提高StanfordCoreNLP ner的准确性?

Stanford nlp 如何提高StanfordCoreNLP ner的准确性?,stanford-nlp,Stanford Nlp,我使用StanfordCoreNLP的NER来识别实体,包括组织、位置和人员。但是有一些奇怪的东西例如,我输入一个类似“克利夫兰骑士”的句子,它会将“克利夫兰”识别为“地点”,而不是将“克利夫兰骑士”识别为组织。 我对ner不是很熟悉,也不知道ner是如何工作的。我的任务是把所有的公司名称都写在文本中,结果不是很令人满意。所以我有两种方法来解决这个问题。首先是修改dict并插入正确的数据。第二个是训练模型。但仍有一些问题 第一种方法有效吗 如果问题1的答案是肯定的,如何修改dict 此外,该网站

我使用StanfordCoreNLP的NER来识别实体,包括组织、位置和人员。但是有一些奇怪的东西例如,我输入一个类似“克利夫兰骑士”的句子,它会将“克利夫兰”识别为“地点”,而不是将“克利夫兰骑士”识别为组织。 我对ner不是很熟悉,也不知道ner是如何工作的。我的任务是把所有的公司名称都写在文本中,结果不是很令人满意。所以我有两种方法来解决这个问题。首先是修改dict并插入正确的数据。第二个是训练模型。但仍有一些问题

  • 第一种方法有效吗
  • 如果问题1的答案是肯定的,如何修改dict
  • 此外,该网站的FAQ列表提出了培训ner模型的方法,但最让我困惑的是如果我培训了我的模型,我会得到什么。

  • 如果我创建一个包含

    “克利夫兰组织” 骑士队“

    为了训练模型,模型中会发生什么?CRFClassizer内的dict将更改

  • 当我输入“克利夫兰骑士队”并将“克利夫兰骑士队”识别为一个组织实体时,CRFClassifier会修改错误吗

  • 这些都是我的难题,我正在准备数据集以尝试第二种方法。有人能回答以上4个问题吗?
    谢谢

    我认为第一种解决方案技术性不强,每次你想给一家新公司贴标签时,你都需要更新字典。 我更喜欢你的第二个解决方案,我以前也这样做过,并训练了一个新的模型来标记我的句子。
    如果你有一个足够大的好语料库,可以正确地标记,那么训练可能需要一些时间,但这是值得的。

    我认为第一个解决方案不是很专业,每次你想标记一家新公司时,你都需要更新字典。 我更喜欢你的第二个解决方案,我以前也这样做过,并训练了一个新的模型来标记我的句子。 如果你有一个足够大的好语料库,并且正确地标记了它,那么训练可能需要一些时间,但这是值得的