Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/293.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Spacy-短语匹配的最大长度当前为10;最大长度为9_Python_Nlp_Spacy - Fatal编程技术网

Python Spacy-短语匹配的最大长度当前为10;最大长度为9

Python Spacy-短语匹配的最大长度当前为10;最大长度为9,python,nlp,spacy,Python,Nlp,Spacy,我正在尝试使用Spacy 2.0创建一个基于规则的短语匹配器。我有一个要匹配的字符串列表,我通过一个NLP管道运行该列表,并删除长度超过9个标记的字符串(Spacy PhraseMatcher的最大值)。这在以前对我有效,但是,当我现在这样做时,我会得到一个错误,好像我在一些文档中有10+个令牌。下面是我的代码的一个可重复性最低的版本,有不同的匹配项(实际上我匹配了大量的匹配项,但是列表理解过滤器仍然应该应用。) matches=[u'This!是!a!Long!String!的!个!示例,u'

我正在尝试使用Spacy 2.0创建一个基于规则的短语匹配器。我有一个要匹配的字符串列表,我通过一个NLP管道运行该列表,并删除长度超过9个标记的字符串(Spacy PhraseMatcher的最大值)。这在以前对我有效,但是,当我现在这样做时,我会得到一个错误,好像我在一些文档中有10+个令牌。下面是我的代码的一个可重复性最低的版本,有不同的匹配项(实际上我匹配了大量的匹配项,但是列表理解过滤器仍然应该应用。)

matches=[u'This!是!a!Long!String!的!个!示例,u'This't']
docs=[d表示列表中的d(nlp.pipe(匹配)),如果len(d)
matches = [u'This! Is! An! Example! of! a! Long! String!', u'This ain\'t']
docs = [d for d in list(nlp.pipe(matches)) if len(d)<10]
matcher = PhraseMatcher(nlp.vocab)
matcher.add('things', None, *docs)