C# 更改Stanford Dependency Parser POS标记标签

C# 更改Stanford Dependency Parser POS标记标签,c#,nlp,stanford-nlp,C#,Nlp,Stanford Nlp,我正在使用Stanford.NLP.NET作为IKVM nugget安装在我当前的C项目中。我将从依赖关系树中提取PoS标记。但出于某些原因,我想把各种类型的名词、形容词、动词和副词标签聚合起来 比如说, n所有名词类型的标签 NN名词,单数或质量 名词,复数 NNP专有名词,单数 NNPS专有名词,复数 所有形容词类型的标签 JJ形容词 比较级形容词 最高级形容词 所有副词类型的r标签 RB副词 比较副词 RBS副词,最高级 所有动词类型的v标签 动词,过去式 动词、动名词或现在分词 动词过去

我正在使用Stanford.NLP.NET作为IKVM nugget安装在我当前的C项目中。我将从依赖关系树中提取PoS标记。但出于某些原因,我想把各种类型的名词、形容词、动词和副词标签聚合起来

比如说,

n所有名词类型的标签

NN名词,单数或质量

名词,复数

NNP专有名词,单数

NNPS专有名词,复数

所有形容词类型的标签

JJ形容词

比较级形容词

最高级形容词

所有副词类型的r标签

RB副词

比较副词

RBS副词,最高级

所有动词类型的v标签

动词,过去式

动词、动名词或现在分词

动词过去分词

VBP动词,非第三人称单数present

VBZ动词,第三人称单数present


我应该在何处进行更改?您为什么不更改代码输出中的标签?例如,每当您看到NN或NNS时,只需将其替换为N。我有大约250个文件,每个文件都有大约90K个字,每次需要为不同的输入处理这些字。我不想在它们上添加额外的处理…您只是在组合输出标签。与预测时间相比,它要快得多。实际上我正在考虑修改stanford dependency代码,但这太费时了,无法编程,所以我编写了一个子字符串,在\之后得到一个字母,这就达到了目的。。。