Apache spark 如何在pyspark中执行学生t测试?

Apache spark 如何在pyspark中执行学生t测试?,apache-spark,pyspark,pyspark-sql,pyspark-dataframes,Apache Spark,Pyspark,Pyspark Sql,Pyspark Dataframes,因为ml.stat模块中没有方法,所以有没有办法在pyspark中执行学生t-test。我没有看到pyspark API的t-test部分。它出现在这里提到的Java版本中[1] 通过查看这里的chisquared实现[2],您可以在python中构建自己的t-test模型,其中他们使用JavaAPI构建python类 1- 2-我没有看到pyspark API的t测试部分。它出现在这里提到的Java版本中[1] 通过查看这里的chisquared实现[2],您可以在python中构建自己的t-

因为ml.stat模块中没有方法,所以有没有办法在pyspark中执行学生t-test。

我没有看到pyspark API的t-test部分。它出现在这里提到的Java版本中[1]

通过查看这里的chisquared实现[2],您可以在python中构建自己的t-test模型,其中他们使用JavaAPI构建python类

1-


2-

我没有看到pyspark API的t测试部分。它出现在这里提到的Java版本中[1]

通过查看这里的chisquared实现[2],您可以在python中构建自己的t-test模型,其中他们使用JavaAPI构建python类

1-


2-

如果您只是想用表示两个不同组的二进制变量进行均值比较,您可以使用
pyspark.ml.regression中的
LinearRegression
。在二进制变量上回归连续变量,然后在拟合模型上调用
summary.t value
。这与在均值t检验中进行比较是一样的。

如果您只是想用表示两个不同组的二进制变量在均值中进行比较,您可以使用
pyspark.ml.regression中的
LinearRegression
。在二进制变量上回归连续变量,然后在拟合模型上调用
summary.t value
。这与均值t检验中的比较相同