Stanford nlp 如何在CoreNLP中转义RegexNER映射文件中的字符?

Stanford nlp 如何在CoreNLP中转义RegexNER映射文件中的字符?,stanford-nlp,Stanford Nlp,我的文本中有以下行: 耳聋(线粒体)修饰基因2的突变 我在我的RegexNER映射文件中尝试了以下几行代码,将耳聋(线粒体)修饰语2标记为基因,但都失败了 耳聋(线粒体)修饰基因2 耳聋\(线粒体\)修饰基因2 似乎问题在于转义括号字符,因为当我从文本和映射文件中删除括号时,它匹配。在RegexNER映射文件中转义字符的正确方法是什么?标记器将括号转换为: -LRB-和-RRB- 因此,您希望:-LRB-mitropolitan-RRB-匹配(mitropolitan) 还要注意,标记器会为每个

我的文本中有以下行:

耳聋(线粒体)修饰基因2的突变

我在我的RegexNER映射文件中尝试了以下几行代码,将耳聋(线粒体)修饰语2标记为基因,但都失败了

耳聋(线粒体)修饰基因2

耳聋\(线粒体\)修饰基因2


似乎问题在于转义括号字符,因为当我从文本和映射文件中删除括号时,它匹配。在RegexNER映射文件中转义字符的正确方法是什么?

标记器将括号转换为:

-LRB-
-RRB-

因此,您希望:
-LRB-mitropolitan-RRB-
匹配
(mitropolitan)


还要注意,标记器会为每个括号创建一个标记。

谢谢。它匹配,但我在实体中提到:“耳聋-LRB-线粒体-RRB-修饰物2”。有没有办法恢复“耳聋(线粒体)修饰物2”或者我应该自己替换-LRB-和-RRB-呢?