Apache spark 使用mllib2+;没有火花依赖

Apache spark 使用mllib2+;没有火花依赖,apache-spark,breeze,apache-spark-mllib,Apache Spark,Breeze,Apache Spark Mllib,既然MLlib在引擎盖下使用Breeze,有没有一种方法可以将MLlib与Breeze数据结构一起使用,这样我就不需要整个Spark生态系统,但仍然可以仅在本地使用MLlib?你不能这样做。如果没有spark core,即使可以提取依赖项,也不能使用spark mllib 不过,如果您想以独立方式从MLLib运行算法,则需要以独立模式安装spark。在这种情况下不需要真正的集群,但解决方案显然无法扩展。完全同意@Eliasah的观点 您甚至可以在IDE项目设置中运行MLlib。我有一个Gradl

既然MLlib在引擎盖下使用Breeze,有没有一种方法可以将MLlib与Breeze数据结构一起使用,这样我就不需要整个Spark生态系统,但仍然可以仅在本地使用MLlib?

你不能这样做。如果没有spark core,即使可以提取依赖项,也不能使用spark mllib


不过,如果您想以独立方式从MLLib运行算法,则需要以独立模式安装spark。在这种情况下不需要真正的集群,但解决方案显然无法扩展。

完全同意@Eliasah的观点

您甚至可以在IDE项目设置中运行MLlib。我有一个Gradle项目要运行MLlib-

dependencies {
    implementation 'org.scala-lang:scala-library:2.11.12'
    compile group: 'org.apache.spark', name: 'spark-core_2.11', version: '2.4.4'
    compile group: 'org.apache.spark', name: 'spark-sql_2.11', version: '2.4.4'
    compile group: 'org.apache.spark', name: 'spark-mllib_2.11', version: '2.4.4'

    runtime group: 'org.apache.spark', name: 'spark-core_2.11', version: '2.4.4'
    runtime group: 'org.apache.spark', name: 'spark-sql_2.11', version: '2.4.4'
    runtime group: 'org.apache.spark', name: 'spark-mllib_2.11', version: '2.4.4'
}