Machine learning spark word2vec窗口大小

Machine learning spark word2vec窗口大小,machine-learning,apache-spark,word2vec,Machine Learning,Apache Spark,Word2vec,是否需要更改pyspark.mllib.feature.Word2Vec中使用的窗口大小,还是永久固定为5?这似乎是一个相当重要的特性 我在这里看不到选项: 这是正确的,查看Word2Vec代码,我们可以看到它是一个私有val。如果需要,您可以覆盖Word2Vec以更改窗口大小。我已经创建了一个JIRA()来允许设置窗口大小,因为1.5已经处于RC阶段,这可能要到1.6倍才能实现。作为后续,我添加了一个windowSize参数,您现在可以使用它来控制1.6+中的窗口大小:)

是否需要更改pyspark.mllib.feature.Word2Vec中使用的窗口大小,还是永久固定为5?这似乎是一个相当重要的特性

我在这里看不到选项:

这是正确的,查看Word2Vec代码,我们可以看到它是一个私有val。如果需要,您可以覆盖Word2Vec以更改窗口大小。我已经创建了一个JIRA()来允许设置窗口大小,因为1.5已经处于RC阶段,这可能要到1.6倍才能实现。

作为后续,我添加了一个
windowSize
参数,您现在可以使用它来控制1.6+中的窗口大小:)