PySpark与Gensim实现分布式在线LDA的比较

PySpark与Gensim实现分布式在线LDA的比较,pyspark,nlp,apache-spark-mllib,gensim,topic-modeling,Pyspark,Nlp,Apache Spark Mllib,Gensim,Topic Modeling,分布式在线LDA由和实现。我想选择其中一个做我的项目 目前,我已经有了一个运行7个工作节点的hadoop系统 请具有这两方面经验的人给出建议并指出它们的优缺点,例如集群设置的难度、建模过程的速度等。谢谢

分布式在线LDA由和实现。我想选择其中一个做我的项目

目前,我已经有了一个运行7个工作节点的hadoop系统

请具有这两方面经验的人给出建议并指出它们的优缺点,例如集群设置的难度、建模过程的速度等。谢谢