为什么spacy会为诸如';zz'?它们不应该是零向量吗

为什么spacy会为诸如';zz'?它们不应该是零向量吗,spacy,Spacy,nlp。('zz')。vector.sum为-10 nlp('asc')。vector.sum为-9.677 这些单词不应该在词汇表之外,并且没有向量吗?根据您使用的模型,培训语料库可能包含许多缩写词、非正式单词(如示例中的单词)、拼写错误,甚至是外部语言的单词。这些仍然被视为词素,并被指定为向量。 Spacy的默认英语模型不包含向量,因此它会尝试从文本中推断向量。如果使用较大的模型,则它们包括向量 v这将没有有效向量 import spacy nlp = spacy.load('en') i

nlp。('zz')。vector.sum为-10

nlp('asc')。vector.sum为-9.677


这些单词不应该在词汇表之外,并且没有向量吗?

根据您使用的模型,培训语料库可能包含许多缩写词、非正式单词(如示例中的单词)、拼写错误,甚至是外部语言的单词。这些仍然被视为词素,并被指定为向量。

Spacy的默认英语模型不包含向量,因此它会尝试从文本中推断向量。如果使用较大的模型,则它们包括向量

v这将没有有效向量

import spacy
nlp = spacy.load('en')

import spacy
nlp = spacy.load('en_core_web_md')
^这将有你正在寻找的向量(我相信)