Python 可以微调FastText模型吗

Python 可以微调FastText模型吗,python,nlp,fasttext,Python,Nlp,Fasttext,我正在使用FastText进行一个文本相似性项目,我发现训练模型的基本示例是: from gensim.models import FastText model = FastText(tokens, size=100, window=3, min_count=1, iter=10, sorted_vocab=1) 据我所知,由于我指定了向量和ngram大小,所以这里的模型是从头开始训练的,如果数据集很小,我会看到很好的结果 我发现的另一个选择是加载原始Wikipedia模型,它是一个巨大的文

我正在使用FastText进行一个文本相似性项目,我发现训练模型的基本示例是:

from gensim.models import FastText

model = FastText(tokens, size=100, window=3, min_count=1, iter=10, sorted_vocab=1)
据我所知,由于我指定了向量和ngram大小,所以这里的模型是从头开始训练的,如果数据集很小,我会看到很好的结果

我发现的另一个选择是加载原始Wikipedia模型,它是一个巨大的文件:

from gensim.models.wrappers import FastText

model = FastText.load_fasttext_format('wiki.simple')

我的问题是,我可以加载Wikipedia或任何其他模型,并使用我的数据集对其进行微调吗

如果您有一个带标签的数据集,那么您应该能够对其进行微调。说明要使用pretrainedVectors选项。你可以从维基百科的预训练向量开始,然后在你的数据集上训练。gensim似乎可以做到这一点,但据报道,已经出现了一些bug

“我想在域语料库上对fasttext嵌入(无监督)进行微调,我该如何实现?”HariPrasad查看我发布的第一个链接。FastText不支持此功能。