Python 差异空间';s"--“基本模型”;及--向量;为NER使用自定义嵌入的参数?

Python 差异空间';s"--“基本模型”;及--向量;为NER使用自定义嵌入的参数?,python,spacy,fasttext,Python,Spacy,Fasttext,我训练了fasttext嵌入并将它们保存为.vec文件。 我想把这些用于我的spacy-NER模型。两者之间有区别吗 python-mspacytrain en[新模型][训练数据][开发数据]--管道ner--基本模型嵌入.vec 及 python-mspacy-train-en[new_model][train_data][dev_data]--管道ner--vectors-embeddings.vec ? 这两种方法都会产生几乎相同的训练损失、F分数等。如果需要使用向量初始化spacy模型

我训练了fasttext嵌入并将它们保存为
.vec
文件。 我想把这些用于我的spacy-NER模型。两者之间有区别吗

python-mspacytrain en[新模型][训练数据][开发数据]--管道ner--基本模型嵌入.vec

python-mspacy-train-en[new_model][train_data][dev_data]--管道ner--vectors-embeddings.vec
?


这两种方法都会产生几乎相同的训练损失、F分数等。

如果需要使用向量初始化spacy模型,请使用
spacy init模型
,其中
lg
是语言代码:

spacy init model lg model_dir-v embeddings.vec-vn my_custom_vectors
将向量保存为空间模型的一部分后:

  • --vectors
    从提供的模型加载向量,因此初始模型为
    spacy.blank(“lg”)
    +vectors
  • --基本模型
    从提供的模型加载所有内容(标记器、管道组件、向量),因此初始模型为
    spacy.load(模型)

如果提供的模型中没有任何管道组件,唯一的潜在差异是由
spacy.blank(“lg”)
产生的标记器设置,该设置在各个spacy版本之间可能略有不同。

如果需要使用向量初始化spacy模型,像这样使用
spacy init model
,其中
lg
是语言代码:

spacy init model lg model_dir-v embeddings.vec-vn my_custom_vectors
将向量保存为空间模型的一部分后:

  • --vectors
    从提供的模型加载向量,因此初始模型为
    spacy.blank(“lg”)
    +vectors
  • --基本模型
    从提供的模型加载所有内容(标记器、管道组件、向量),因此初始模型为
    spacy.load(模型)
如果提供的模型中没有任何管道组件,则唯一的潜在差异是由
spacy.blank(“lg”)
产生的标记器设置,该设置在各个spacy版本之间可能略有不同