Stanford nlp 如何在CoreNLP中转义RegexNER映射文件中的字符?
我的文本中有以下行: 耳聋(线粒体)修饰基因2的突变 我在我的RegexNER映射文件中尝试了以下几行代码,将耳聋(线粒体)修饰语2标记为基因,但都失败了 耳聋(线粒体)修饰基因2 耳聋\(线粒体\)修饰基因2Stanford nlp 如何在CoreNLP中转义RegexNER映射文件中的字符?,stanford-nlp,Stanford Nlp,我的文本中有以下行: 耳聋(线粒体)修饰基因2的突变 我在我的RegexNER映射文件中尝试了以下几行代码,将耳聋(线粒体)修饰语2标记为基因,但都失败了 耳聋(线粒体)修饰基因2 耳聋\(线粒体\)修饰基因2 似乎问题在于转义括号字符,因为当我从文本和映射文件中删除括号时,它匹配。在RegexNER映射文件中转义字符的正确方法是什么?标记器将括号转换为: -LRB-和-RRB- 因此,您希望:-LRB-mitropolitan-RRB-匹配(mitropolitan) 还要注意,标记器会为每个
似乎问题在于转义括号字符,因为当我从文本和映射文件中删除括号时,它匹配。在RegexNER映射文件中转义字符的正确方法是什么?标记器将括号转换为:
-LRB-
和-RRB-
因此,您希望:-LRB-mitropolitan-RRB-
匹配(mitropolitan)
还要注意,标记器会为每个括号创建一个标记。谢谢。它匹配,但我在实体中提到:“耳聋-LRB-线粒体-RRB-修饰物2”。有没有办法恢复“耳聋(线粒体)修饰物2”或者我应该自己替换-LRB-和-RRB-呢?