Python NLTK语法分析器中单词和词性标记的混合

Python NLTK语法分析器中单词和词性标记的混合,python,python-2.7,nlp,nltk,Python,Python 2.7,Nlp,Nltk,我已经使用NLTK有一段时间了,现在正在为特殊的分块定义自定义解析器语法。我遵循中的描述,但我感兴趣的是做的与本章中描述的略有不同。例如,在示例7.10中,动词阶段使用以下内容: VP:{+$} 我只想匹配使用一个特定动词而不是任何动词的句子。比如: VP:{go+$} 换句话说,我希望匹配单词的实际单词而不是词性标记,并在正则表达式中混合匹配实际单词和词性标记 这是可能的吗?没有nltk PoS标记器大量生产的标准PoS标记 如果您需要为不同的动词编写语法,一个有用的技巧可能是对标记进行预处理

我已经使用NLTK有一段时间了,现在正在为特殊的分块定义自定义解析器语法。我遵循中的描述,但我感兴趣的是做的与本章中描述的略有不同。例如,在示例7.10中,动词阶段使用以下内容: VP:{+$} 我只想匹配使用一个特定动词而不是任何动词的句子。比如: VP:{go+$}

换句话说,我希望匹配单词的实际单词而不是词性标记,并在正则表达式中混合匹配实际单词和词性标记


这是可能的吗?

没有nltk PoS标记器大量生产的标准PoS标记


如果您需要为不同的动词编写语法,一个有用的技巧可能是对标记进行预处理,并将标记附加到所有动词的标记中。因此,您可以使用类似VP:{+$}

的正则表达式字符串。也许您可以预处理语料库,将“go”的词性标签从“VB”更改为“go”,然后使用标准设置?