Stanford nlp 如何将地名录与Tokensregex一起使用?

Stanford nlp 如何将地名录与Tokensregex一起使用?,stanford-nlp,Stanford Nlp,我已经成功地将tokensregex用于基于规则的命名实体识别,但希望通过添加地名录作为附加层来提高准确性 我的数据实际上不是在一个文件中,而是在一个看起来像: {“中国”=[“上海”、“北京”、“贡佐”…]、“英国”=[“伦敦”、“曼彻斯特”、“爱丁堡”…]}其中关键是国家名称,而价值是相应的城市 我可以使用这种格式,即地图,还是需要一个带有位置名称和位置标签的tsv文件 如何将地名索引注释与tokensregex一起使用 另外,既然托克斯规则每次只看一个标记,我如何匹配地名录中的多标记词,如

我已经成功地将tokensregex用于基于规则的命名实体识别,但希望通过添加地名录作为附加层来提高准确性

我的数据实际上不是在一个文件中,而是在一个看起来像: {“中国”=[“上海”、“北京”、“贡佐”…]、“英国”=[“伦敦”、“曼彻斯特”、“爱丁堡”…]}其中关键是国家名称,而价值是相应的城市

  • 我可以使用这种格式,即地图,还是需要一个带有位置名称和位置标签的tsv文件

  • 如何将地名索引注释与tokensregex一起使用

  • 另外,既然托克斯规则每次只看一个标记,我如何匹配地名录中的多标记词,如纽约


  • 您可以尝试运行
    regexner
    注释器作为第一层来执行基于词典的查找。这允许使用字典使用特定的NER标记标记令牌序列

    此处的文档: