Stanford nlp 宪报刊登者名单应包括哪些内容?

Stanford nlp 宪报刊登者名单应包括哪些内容?,stanford-nlp,Stanford Nlp,我试图从酒店评论中提取位置,我所说的位置是指酒店名称、城市、街区、POI和国家。我使用的是一份有165000家实体的公报列表[该列表没有酒店名称]标记为位置。 我已经打开了sloppygazette,但是这个gazette帮不了什么忙。我不知道我应该在宪报的名单中包括什么 PS:就NLP而言,我是一个新手,因此对于要使用哪些功能的帮助很少,我非常感激。您好,这里有关于NER功能的更详细的新文档: 规则格式为每行一条规则: 洛杉矶城市位置,杂项1.0 中国长城地标位置,MISC 1.0 一些功能

我试图从酒店评论中提取位置,我所说的位置是指酒店名称、城市、街区、POI和国家。我使用的是一份有165000家实体的公报列表[该列表没有酒店名称]标记为位置。 我已经打开了sloppygazette,但是这个gazette帮不了什么忙。我不知道我应该在宪报的名单中包括什么


PS:就NLP而言,我是一个新手,因此对于要使用哪些功能的帮助很少,我非常感激。

您好,这里有关于NER功能的更详细的新文档:

规则格式为每行一条规则:

洛杉矶城市位置,杂项1.0

中国长城地标位置,MISC 1.0

一些功能只有在使用GitHub的最新代码时才可用,但斯坦福CoreNLP 3.9.1中提供了很多功能

简而言之,NER注释器将运行以下步骤:

  • 统计NER模型
  • 数字序列和SUTime规则(用于时间和日期)
  • 细粒度NER的规则(城市、州或省、国家等)
  • 用户指定的其他规则(这是新规则,目前在3.9.1中不可用)
  • 构建实体提及(确定标记“Los”和“Angeles”应为实体“Los Angeles”)

  • 您可以从GitHub下载代码并构建最新版本,或者只需将您的自定义规则添加到
    ner.fine.regexner
    注释器中,如上面的链接所述。

    如果我想在文本中标记位置,您能给我一个地名典应该包含哪些内容的示例吗?我在这里谈论的是专有名词,如Times Squ是或中国长城。规则格式与答案中洛杉矶的示例规则相同。规则文件每行有一条规则。我为中国长城添加了一个示例…第二列是要应用的标记。您可以将其设置为任何您想要的。但是,如果您想将其设置为位置,则应该从t中删除位置hird列,这是可被规则覆盖的命名实体标记列表。我的意思是,如果我想标记位置,我应该包括什么类型的实体,假设我的培训数据中没有中国长城,并且想在测试数据中标记为位置,但在公报中包含它没有任何效果。它仍然没有标记为地点。