Apache spark 为Spark ML管道中的最终分类任务优化Word2Vec
我想在Spark管道中对Word2Vec模型进行交叉验证网格搜索,以解决最终的二进制分类问题。现在,我离线训练Word2Vec,然后在二进制分类步骤中加载它。编码列然后用作逻辑回归模型的输入。我希望能够将Word2Vec的hyperparameters添加到我的param网格中进行搜索,但不确定是否可以调整这些HP参数以优化我的逻辑回归分类器。如何使用Word2Vec作为管道中的转换器和可以通过交叉验证网格搜索进行优化的估计器Apache spark 为Spark ML管道中的最终分类任务优化Word2Vec,apache-spark,machine-learning,Apache Spark,Machine Learning,我想在Spark管道中对Word2Vec模型进行交叉验证网格搜索,以解决最终的二进制分类问题。现在,我离线训练Word2Vec,然后在二进制分类步骤中加载它。编码列然后用作逻辑回归模型的输入。我希望能够将Word2Vec的hyperparameters添加到我的param网格中进行搜索,但不确定是否可以调整这些HP参数以优化我的逻辑回归分类器。如何使用Word2Vec作为管道中的转换器和可以通过交叉验证网格搜索进行优化的估计器