在Python中,如何提取包含一个特定单词列表和一个形容词的句子
要提取包含一组指定单词和任何形容词的所有句子,例如“非常好” 我用词性标记每个单词,以便识别任何形容词。然后,我使用正则表达式指定了模式。代码如下:在Python中,如何提取包含一个特定单词列表和一个形容词的句子,python,regex,nlp,regular-language,chunking,Python,Regex,Nlp,Regular Language,Chunking,要提取包含一组指定单词和任何形容词的所有句子,例如“非常好” 我用词性标记每个单词,以便识别任何形容词。然后,我使用正则表达式指定了模式。代码如下: import nltk import os import string import re s=["This","Movie","is","very","good"]; v=["extremely","very"]; tagged=nltk.pos_tag(s); grammar= """Chunk: {[v[0]-v[4]]<JJ&g
import nltk
import os
import string
import re
s=["This","Movie","is","very","good"];
v=["extremely","very"];
tagged=nltk.pos_tag(s);
grammar= """Chunk: {[v[0]-v[4]]<JJ>}""";
parser=nltk.RegexpParser(grammar);
t=parser.parse(tagged);
导入nltk
导入操作系统
导入字符串
进口稀土
s=[“这”、“电影”、“是”、“非常”、“好”];
v=[“非常”、“非常”];
标记=nltk.pos_标记;
grammar=“”块:{[v[0]-v[4]]}”“;
parser=nltk.RegexpParser(语法);
t=parser.parse(标记);
但它无法识别我指定的模式,没有一对被标记为“Chunk”。您可以将列表转换为集合,然后使用
.issubset()
?但这只是一个粗糙的方法