Python 使用NLTK组块括号

Python 使用NLTK组块括号,python,regex,nltk,chunking,Python,Regex,Nltk,Chunking,我正在使用NLTK,并试图从以下文本中分块(AIM 20-40-60): text=有关更多信息,请参阅业务报告政策(AIM 20-40-60) 目前我正在使用下面的块模式grammar=r“chunk:{}”,它能够完美地捕获aim20-40-60部分 尽管如此,我还是希望括号()也是块的一部分,因为我对正则表达式和块比较陌生,所以我不知道捕获括号的确切正则表达式模式。解决方案如下 grammar=r“CHUNK:{}”尝试grammar=r“\(CHUNK:{}\)”(或grammar=r“

我正在使用NLTK,并试图从以下文本中分块
(AIM 20-40-60)

text=有关更多信息,请参阅业务报告政策(AIM 20-40-60)

目前我正在使用下面的块模式
grammar=r“chunk:{}”
,它能够完美地捕获
aim20-40-60
部分


尽管如此,我还是希望括号
()
也是块的一部分,因为我对正则表达式和块比较陌生,所以我不知道捕获括号的确切正则表达式模式。

解决方案如下


grammar=r“CHUNK:{}”

尝试
grammar=r“\(CHUNK:{}\)”
(或
grammar=r“CHUNK:{\(\)}”
)我尝试了两个版本,但不幸的是都不起作用。不过还是要谢谢你:)好吧,你明白要点了。将
\(
\)
添加到这些令牌中的某个位置。chunker模式匹配POS标记序列,而不是表面字符串。所以,您需要匹配POS标记器给出的任何标记,而不是文字
()
。@lenz嘿,伙计,您是对的。刚刚解决了这个问题。这是我使用的模式
grammar=r“CHUNK:{}”