Machine learning word2vec对监督学习有意义吗?

Machine learning word2vec对监督学习有意义吗?,machine-learning,nlp,word2vec,supervised-learning,unsupervised-learning,Machine Learning,Nlp,Word2vec,Supervised Learning,Unsupervised Learning,我有一个句子/标签对列表来训练模型,我应该如何将这些句子编码为输入,比如SVM?这些句子是同一种语言吗?你可以从预先训练好的word2vec文件开始,如果它是英文的话,你可以从谷歌下载。注意火车文件是如何创建的,是否应用了词干分析,等等。从哪个语料库生成它也有点重要;如果这是从新闻组或从网络或更正式的文本中提取的,则会得到不同的结果 Word2Vec基本上将每个单词编码到更高维的向量空间中。这通常是200300或500大尺寸。经过训练后,“测试”句子基本上是一袋单词,不需要任何顺序 然后,对于单

我有一个句子/标签对列表来训练模型,我应该如何将这些句子编码为输入,比如SVM?

这些句子是同一种语言吗?你可以从预先训练好的word2vec文件开始,如果它是英文的话,你可以从谷歌下载。注意火车文件是如何创建的,是否应用了词干分析,等等。从哪个语料库生成它也有点重要;如果这是从新闻组或从网络或更正式的文本中提取的,则会得到不同的结果

Word2Vec基本上将每个单词编码到更高维的向量空间中。这通常是200300或500大尺寸。经过训练后,“测试”句子基本上是一袋单词,不需要任何顺序

然后,对于单词包中的每个单词,计算出相应的word2vec向量。然后你可以通过平均向量来创建特征,取“最小值”和“最大值”,如果你在比较文本,看看如何计算向量之间的余弦相似性。然后在SVM中使用这些特征