在Python中，如何提取包含一个特定单词列表和一个形容词的句子_Python_Regex_Nlp_Regular Language_Chunking

在Python中，如何提取包含一个特定单词列表和一个形容词的句子

python regex nlp

在Python中，如何提取包含一个特定单词列表和一个形容词的句子,python,regex,nlp,regular-language,chunking,Python,Regex,Nlp,Regular Language,Chunking,要提取包含一组指定单词和任何形容词的所有句子，例如“非常好” 我用词性标记每个单词，以便识别任何形容词。然后，我使用正则表达式指定了模式。代码如下： import nltk import os import string import re s=["This","Movie","is","very","good"]; v=["extremely","very"]; tagged=nltk.pos_tag(s); grammar= """Chunk: {[v[0]-v[4]]<JJ&g

要提取包含一组指定单词和任何形容词的所有句子，例如“非常好”

我用词性标记每个单词，以便识别任何形容词。然后，我使用正则表达式指定了模式。代码如下：

import nltk
import os
import string
import re

s=["This","Movie","is","very","good"];
v=["extremely","very"];

tagged=nltk.pos_tag(s);

grammar= """Chunk: {[v[0]-v[4]]<JJ>}""";
parser=nltk.RegexpParser(grammar);
t=parser.parse(tagged);

导入nltk
导入操作系统
导入字符串
进口稀土
s=[“这”、“电影”、“是”、“非常”、“好”]；
v=[“非常”、“非常”]；
标记=nltk.pos_标记；
grammar=“”块：{[v[0]-v[4]]}”“；
parser=nltk.RegexpParser（语法）；
t=parser.parse（标记）；

但它无法识别我指定的模式，没有一对被标记为“Chunk”。

您可以将列表转换为集合，然后使用

.issubset（）

？但这只是一个粗糙的方法