Python 打包数据以确定相关性的最佳格式?
我正在使用Java程序提取一些数据点,并计划使用Python 打包数据以确定相关性的最佳格式?,python,csv,scipy,correlation,Python,Csv,Scipy,Correlation,我正在使用Java程序提取一些数据点,并计划使用scipy确定相关系数。我计划将数据提取到csv样式的文件中。我应该如何格式化每个对应的数据集,以便我可以轻松地将其读入scipy?每个数据集都是一列,所有数据集组合在一起形成一个CSV。它被numpy.genfromtxt()读取为2D数组,然后调用numpy.corrcoef()获取相关系数 注:您也应该考虑相同的数据布局,但是使用熊猫> /CODE >。通过pandas将CSV读入dataframe。通过.corr()读取CSV(),并获得相
scipy
确定相关系数。我计划将数据提取到csv样式的文件中。我应该如何格式化每个对应的数据集,以便我可以轻松地将其读入scipy
?每个数据集都是一列,所有数据集组合在一起形成一个CSV。它被numpy.genfromtxt()
读取为2D数组
,然后调用numpy.corrcoef()
获取相关系数
注:您也应该考虑相同的数据布局,但是使用<代码>熊猫> /CODE >。通过
pandas将CSV读入dataframe
。通过.corr()
读取CSV()
,并获得相关系数,谢谢。我想进一步挑战你。如果我有多组数据,如何将其分解?我可以在csv文件中插入“主题1”、“主题2”等。