Python 可以微调FastText模型吗_Python_Nlp_Fasttext

Python 可以微调FastText模型吗

python nlp

Python 可以微调FastText模型吗,python,nlp,fasttext,Python,Nlp,Fasttext,我正在使用FastText进行一个文本相似性项目，我发现训练模型的基本示例是： from gensim.models import FastText model = FastText(tokens, size=100, window=3, min_count=1, iter=10, sorted_vocab=1) 据我所知，由于我指定了向量和ngram大小，所以这里的模型是从头开始训练的，如果数据集很小，我会看到很好的结果我发现的另一个选择是加载原始Wikipedia模型，它是一个巨大的文

我正在使用FastText进行一个文本相似性项目，我发现训练模型的基本示例是：

from gensim.models import FastText

model = FastText(tokens, size=100, window=3, min_count=1, iter=10, sorted_vocab=1)

据我所知，由于我指定了向量和ngram大小，所以这里的模型是从头开始训练的，如果数据集很小，我会看到很好的结果

我发现的另一个选择是加载原始Wikipedia模型，它是一个巨大的文件：

from gensim.models.wrappers import FastText

model = FastText.load_fasttext_format('wiki.simple')

我的问题是，我可以加载Wikipedia或任何其他模型，并使用我的数据集对其进行微调吗

如果您有一个带标签的数据集，那么您应该能够对其进行微调。说明要使用pretrainedVectors选项。你可以从维基百科的预训练向量开始，然后在你的数据集上训练。gensim似乎可以做到这一点，但据报道，已经出现了一些bug

“我想在域语料库上对fasttext嵌入（无监督）进行微调，我该如何实现？”HariPrasad查看我发布的第一个链接。FastText不支持此功能。