基于Tensorflow的文档相似性研究

基于Tensorflow的文档相似性研究,tensorflow,topic-modeling,Tensorflow,Topic Modeling,我对TensorFlow和文档相似性/主题建模都是新手,因此,如果我的问题没有完全意义,我深表歉意 从我有限的理解来看,主题建模是使用诸如LSA、LDA等算法完成的。我见过使用gensim和LSA的代码,但对于我心目中的大型文档集来说,培训时间非常长。因此,CPU和RAM资源非常繁重 Tensorflow似乎没有本地LSA或LDA实现 如能就以下事项发表意见,我将不胜感激: 使用Tensorflow实现的LDA会比使用gensim实现的LDA具有更好的性能吗 有人能告诉我其他的Tensorfl

我对TensorFlow和文档相似性/主题建模都是新手,因此,如果我的问题没有完全意义,我深表歉意

从我有限的理解来看,主题建模是使用诸如LSA、LDA等算法完成的。我见过使用gensim和LSA的代码,但对于我心目中的大型文档集来说,培训时间非常长。因此,CPU和RAM资源非常繁重

Tensorflow似乎没有本地LSA或LDA实现

如能就以下事项发表意见,我将不胜感激:

  • 使用Tensorflow实现的LDA会比使用gensim实现的LDA具有更好的性能吗

  • 有人能告诉我其他的Tensorflow原语,我应该考虑文档相似性而不是LDA吗

如果我的问题过于含糊,没有提供足够的信息,无法给出适当的答复,我再次表示歉意。我是这个领域的新手,如果有人能给我指点方向,我将不胜感激

谢谢你抽出时间

问候,,
据我所知,TensorFlow目前没有LDA的任何内置功能。然而,它确实有word2vec(就像Gensim一样)-如果你真的想使用TensorFlow,你可以使用word2vec,通过单词嵌入更好地理解你的文档;然后,您可以使用t-SNE可视化这些单词嵌入。我很感激这不是文档比较,但这只是一个开始。据我所知,TensorFlow目前没有LDA的任何内置功能。然而,它确实有word2vec(就像Gensim一样)-如果你真的想使用TensorFlow,你可以使用word2vec,通过单词嵌入更好地理解你的文档;然后,您可以使用t-SNE可视化这些单词嵌入。我很感激这不是文档比较,但这只是一个开始。