Python 有没有办法测试数据X和二进制输出Y之间的相关性?
我试图找到一个Python方法/库来测试自变量X和二进制输出Y之间的相关性 例如,假设我有以下数据和输出: XYPython 有没有办法测试数据X和二进制输出Y之间的相关性?,python,optimization,correlation,Python,Optimization,Correlation,我试图找到一个Python方法/库来测试自变量X和二进制输出Y之间的相关性 例如,假设我有以下数据和输出: XY 0.651 0.110 0.130 0.351 0.210 如果(X>0.3),则输出Y为1,否则为0。如果我不知道这种相关性(阈值0.3),是否有统计方法/测试来找出X和Y之间的相关性程度 例如,某个返回 x = [0.65, 0.11, 0.13, 0.31, 0.21] y = [1, 0, 0, 1, 0] print some_test(x, y) ==> ret
0.651
0.110
0.130
0.351
0.210
如果(X>0.3),则输出Y为1,否则为0。如果我不知道这种相关性(阈值0.3),是否有统计方法/测试来找出X和Y之间的相关性程度 例如,某个返回
x = [0.65, 0.11, 0.13, 0.31, 0.21]
y = [1, 0, 0, 1, 0]
print some_test(x, y)
==> returns "degree of correlation = 1.0"
谢谢您正在寻找一个,当您的一个变量是二分法时使用
from scipy import stats
stats.pointbiserialr(x,y)
如果你只是想知道X是否因Y的值而不同,你应该使用t检验