Nlp 我想根据一些句子的语义对它们进行分类。在这里我如何使用Doc2Vec?还是有比这更好的方法?

Nlp 我想根据一些句子的语义对它们进行分类。在这里我如何使用Doc2Vec?还是有比这更好的方法?,nlp,semantics,word2vec,doc2vec,Nlp,Semantics,Word2vec,Doc2vec,我想在我们从源代码中提取的各种评论上实现doc2vec,并且我想将这些评论分类到用户定义的不同类中。我怎样才能做到这一点呢? < P>我认为这是一个有趣的问题。我将根据观察/评论的规模向您介绍一些方法 您可以应用LSA(DTM上的SVD(关联向量或TF-IDF向量),您将获得三个向量作为输出——USV。V转置是句子嵌入) 使用此嵌入作为模型分类的输入 我建议在语料库较大时使用LSA 资源: 以类似的方式代替使用LSA,您可以使用预先训练过的嵌入,比如手套,这里您将使用逆加权频率方法获得用于

我想在我们从源代码中提取的各种评论上实现doc2vec,并且我想将这些评论分类到用户定义的不同类中。我怎样才能做到这一点呢?

< P>我认为这是一个有趣的问题。我将根据观察/评论的规模向您介绍一些方法

  • 您可以应用LSA(DTM上的SVD(关联向量或TF-IDF向量),您将获得三个向量作为输出——USV。V转置是句子嵌入)
使用此嵌入作为模型分类的输入

我建议在语料库较大时使用LSA

资源

  • 以类似的方式代替使用LSA,您可以使用预先训练过的嵌入,比如手套,这里您将使用逆加权频率方法获得用于创建文档向量的单词嵌入。使用此文档向量进行分类
资源