Java TokenRegex规则,不包括任何其他规则捕获的令牌
我正在使用stanford nlp tokenRegex进行标记化。我正在使用一个正则表达式文件。以下是我使用的规则Java TokenRegex规则,不包括任何其他规则捕获的令牌,java,stanford-nlp,Java,Stanford Nlp,我正在使用stanford nlp tokenRegex进行标记化。我正在使用一个正则表达式文件。以下是我使用的规则 规则1: { ruleType:"tokens", pattern:([{tag:/NN/}|{tag:/NNP/}]), result:"Single noun" } 规则2 { ruleType: "tokens", pattern:([{tag:/NN.*/}|{tag:/CD*/}]), result : "Noun with N
规则1
:
{
ruleType:"tokens",
pattern:([{tag:/NN/}|{tag:/NNP/}]),
result:"Single noun"
}
规则2
{
ruleType: "tokens",
pattern:([{tag:/NN.*/}|{tag:/CD*/}]),
result : "Noun with Number"
}
我给出的句子是“用三星笔记本9笔记笔记”,结果如下
注释->单个名词
三星笔记本电脑9笔->带数字的名词
即使三星、笔记本、钢笔的POS机。。。是NN
它被排除在外。
规则1
未捕获该词,即规则2
捕获的词被规则1
排除
有什么办法可以同时符合这两条规则吗