Apache spark 如何在pyspark中执行学生t测试?
因为ml.stat模块中没有方法,所以有没有办法在pyspark中执行学生t-test。我没有看到pyspark API的t-test部分。它出现在这里提到的Java版本中[1] 通过查看这里的chisquared实现[2],您可以在python中构建自己的t-test模型,其中他们使用JavaAPI构建python类 1-Apache spark 如何在pyspark中执行学生t测试?,apache-spark,pyspark,pyspark-sql,pyspark-dataframes,Apache Spark,Pyspark,Pyspark Sql,Pyspark Dataframes,因为ml.stat模块中没有方法,所以有没有办法在pyspark中执行学生t-test。我没有看到pyspark API的t-test部分。它出现在这里提到的Java版本中[1] 通过查看这里的chisquared实现[2],您可以在python中构建自己的t-test模型,其中他们使用JavaAPI构建python类 1- 2-我没有看到pyspark API的t测试部分。它出现在这里提到的Java版本中[1] 通过查看这里的chisquared实现[2],您可以在python中构建自己的t-
2-我没有看到pyspark API的t测试部分。它出现在这里提到的Java版本中[1] 通过查看这里的chisquared实现[2],您可以在python中构建自己的t-test模型,其中他们使用JavaAPI构建python类 1-
2-如果您只是想用表示两个不同组的二进制变量进行均值比较,您可以使用
pyspark.ml.regression中的LinearRegression
。在二进制变量上回归连续变量,然后在拟合模型上调用summary.t value
。这与在均值t检验中进行比较是一样的。如果您只是想用表示两个不同组的二进制变量在均值中进行比较,您可以使用pyspark.ml.regression中的LinearRegression
。在二进制变量上回归连续变量,然后在拟合模型上调用summary.t value
。这与均值t检验中的比较相同