Nlp 手套词嵌入支持的语言

Nlp 手套词嵌入支持的语言,nlp,stanford-nlp,word-embedding,Nlp,Stanford Nlp,Word Embedding,我开始尝试单词嵌入,我发现了一些我不知道如何解释的结果 我首先使用一个英语语料库进行训练和测试,然后,我使用英语语料库进行训练,使用一个小型法语语料库进行测试(所有语料库都为相同的二元分类任务进行了注释)。在这两种情况下,我都使用了预先训练过的tweets手套嵌入 当我同时使用法语语料库的结果得到改善时(几乎提高了5%,达到~accurity=0.8),我想知道手套是否接受过多语言数据的训练 例如,与FastText相比,我没有看到任何人这样说,在FastText中,您有不同语言的嵌入。有指向其

我开始尝试单词嵌入,我发现了一些我不知道如何解释的结果

我首先使用一个英语语料库进行训练和测试,然后,我使用英语语料库进行训练,使用一个小型法语语料库进行测试(所有语料库都为相同的二元分类任务进行了注释)。在这两种情况下,我都使用了预先训练过的tweets手套嵌入

当我同时使用法语语料库的结果得到改善时(几乎提高了5%,达到~accurity=0.8),我想知道手套是否接受过多语言数据的训练

例如,与FastText相比,我没有看到任何人这样说,在FastText中,您有不同语言的嵌入。

有指向其预训练词向量的源数据的链接。主要的似乎都是用英语写的,但我没有看实际的数据。例如,我认为常见的爬网数据可能包括其他语言。我猜拥有多种语言通常不会造成太大伤害,而且在像您这样的场景中可能会很有用。另一方面,看起来他们确实希望这些模型是针对英语的。对于许多语言都有单独的向量。具有指向其预训练词向量的源数据的链接。主要的似乎都是用英语写的,但我没有看实际的数据。例如,我认为常见的爬网数据可能包括其他语言。我猜拥有多种语言通常不会造成太大伤害,而且在像您这样的场景中可能会很有用。另一方面,看起来他们确实希望这些模型是针对英语的。对于许多语言都有单独的向量。