在Python中,如何提取包含一个特定单词列表和一个形容词的句子

在Python中,如何提取包含一个特定单词列表和一个形容词的句子,python,regex,nlp,regular-language,chunking,Python,Regex,Nlp,Regular Language,Chunking,要提取包含一组指定单词和任何形容词的所有句子,例如“非常好” 我用词性标记每个单词,以便识别任何形容词。然后,我使用正则表达式指定了模式。代码如下: import nltk import os import string import re s=["This","Movie","is","very","good"]; v=["extremely","very"]; tagged=nltk.pos_tag(s); grammar= """Chunk: {[v[0]-v[4]]<JJ&g

要提取包含一组指定单词和任何形容词的所有句子,例如“非常好”

我用词性标记每个单词,以便识别任何形容词。然后,我使用正则表达式指定了模式。代码如下:

import nltk
import os
import string
import re

s=["This","Movie","is","very","good"];
v=["extremely","very"];

tagged=nltk.pos_tag(s);

grammar= """Chunk: {[v[0]-v[4]]<JJ>}""";
parser=nltk.RegexpParser(grammar);
t=parser.parse(tagged); 
导入nltk
导入操作系统
导入字符串
进口稀土
s=[“这”、“电影”、“是”、“非常”、“好”];
v=[“非常”、“非常”];
标记=nltk.pos_标记;
grammar=“”块:{[v[0]-v[4]]}”“;
parser=nltk.RegexpParser(语法);
t=parser.parse(标记);

但它无法识别我指定的模式,没有一对被标记为“Chunk”。

您可以将列表转换为集合,然后使用
.issubset()
?但这只是一个粗糙的方法