Python 使用NLTK组块括号
我正在使用NLTK,并试图从以下文本中分块Python 使用NLTK组块括号,python,regex,nltk,chunking,Python,Regex,Nltk,Chunking,我正在使用NLTK,并试图从以下文本中分块(AIM 20-40-60): text=有关更多信息,请参阅业务报告政策(AIM 20-40-60) 目前我正在使用下面的块模式grammar=r“chunk:{}”,它能够完美地捕获aim20-40-60部分 尽管如此,我还是希望括号()也是块的一部分,因为我对正则表达式和块比较陌生,所以我不知道捕获括号的确切正则表达式模式。解决方案如下 grammar=r“CHUNK:{}”尝试grammar=r“\(CHUNK:{}\)”(或grammar=r“
(AIM 20-40-60)
:
text=有关更多信息,请参阅业务报告政策(AIM 20-40-60)
目前我正在使用下面的块模式grammar=r“chunk:{}”
,它能够完美地捕获aim20-40-60
部分
尽管如此,我还是希望括号
()
也是块的一部分,因为我对正则表达式和块比较陌生,所以我不知道捕获括号的确切正则表达式模式。解决方案如下
grammar=r“CHUNK:{}”
尝试grammar=r“\(CHUNK:{}\)”
(或grammar=r“CHUNK:{\(\)}”
)我尝试了两个版本,但不幸的是都不起作用。不过还是要谢谢你:)好吧,你明白要点了。将\(
和\)
添加到这些令牌中的某个位置。chunker模式匹配POS标记序列,而不是表面字符串。所以,您需要匹配POS标记器给出的任何标记,而不是文字()
。@lenz嘿,伙计,您是对的。刚刚解决了这个问题。这是我使用的模式grammar=r“CHUNK:{}”