Python 使用NLTK组块括号_Python_Regex_Nltk_Chunking

Python 使用NLTK组块括号

python regex

Python 使用NLTK组块括号,python,regex,nltk,chunking,Python,Regex,Nltk,Chunking,我正在使用NLTK，并试图从以下文本中分块（AIM 20-40-60）： text=有关更多信息，请参阅业务报告政策（AIM 20-40-60）目前我正在使用下面的块模式grammar=r“chunk:{}”，它能够完美地捕获aim20-40-60部分尽管如此，我还是希望括号（）也是块的一部分，因为我对正则表达式和块比较陌生，所以我不知道捕获括号的确切正则表达式模式。解决方案如下 grammar=r“CHUNK:{}”尝试grammar=r“\（CHUNK:{}\）”（或grammar=r“

我正在使用NLTK，并试图从以下文本中分块

（AIM 20-40-60）

：

text=有关更多信息，请参阅业务报告政策（AIM 20-40-60）

目前我正在使用下面的块模式

grammar=r“chunk:{}”

，它能够完美地捕获

aim20-40-60

部分

尽管如此，我还是希望括号

（）

也是块的一部分，因为我对正则表达式和块比较陌生，所以我不知道捕获括号的确切正则表达式模式。

解决方案如下

grammar=r“CHUNK:{}”

尝试

grammar=r“\（CHUNK:{}\）”

（或

grammar=r“CHUNK:{\（\）}”

）我尝试了两个版本，但不幸的是都不起作用。不过还是要谢谢你：）好吧，你明白要点了。将

\（

和

\）

添加到这些令牌中的某个位置。chunker模式匹配POS标记序列，而不是表面字符串。所以，您需要匹配POS标记器给出的任何标记，而不是文字

（）

。@lenz嘿，伙计，您是对的。刚刚解决了这个问题。这是我使用的模式

grammar=r“CHUNK:{}”