Python 零件日期的数据帧相关性
我有一个熊猫数据框架,它有一个七年期的DateTime指数和10种不同资产的价格数据。我想运行dataframe.corr函数来评估资产之间的关系,我的问题是我想在特定月份运行corr函数。那么,在所有年份中,1月份的相关性是什么 从我读到的内容来看,如果我按时间分组,我可能会失去正确的时间进程,这将使相关分析毫无用处Python 零件日期的数据帧相关性,python,pandas,dataframe,correlation,Python,Pandas,Dataframe,Correlation,我有一个熊猫数据框架,它有一个七年期的DateTime指数和10种不同资产的价格数据。我想运行dataframe.corr函数来评估资产之间的关系,我的问题是我想在特定月份运行corr函数。那么,在所有年份中,1月份的相关性是什么 从我读到的内容来看,如果我按时间分组,我可能会失去正确的时间进程,这将使相关分析毫无用处 如何按月对数据帧进行分组并维护时间顺序?使用df['month']=df.index.month从DatetimeIndex中提取月份。然后按月份分组: import numpy
如何按月对数据帧进行分组并维护时间顺序?使用
df['month']=df.index.month
从DatetimeIndex中提取月份。然后按月份分组:
import numpy as np
import pandas as pd
N = 100
index = pd.date_range('2000-1-1', periods=N, freq='B')
df = pd.DataFrame(np.random.random((N,3)), index=index)
df['month'] = df.index.month
result = df.groupby('month').corr()
print(result.head(9))
生成其前几行如下所示的数据帧:
0 1 2
month
1 0 1.000000 -0.000325 -0.208282
1 -0.000325 1.000000 -0.236316
2 -0.208282 -0.236316 1.000000
2 0 1.000000 0.056222 -0.010197
1 0.056222 1.000000 -0.140247
2 -0.010197 -0.140247 1.000000
3 0 1.000000 -0.064615 -0.111025
1 -0.064615 1.000000 -0.100798
2 -0.111025 -0.100798 1.000000
这显示了数据帧的列之间的相关性。注意
该指数是一个多指数,其第一级为月份,第二级为月份
指与关联关联的两个数据帧列之一
corr
方法忽略索引——它将数据帧的两列视为数组。
因此,分组数据的时间间隔没有问题。除了我原来的问题之外,我是否可以按月份和列名过滤corr方法?i、 e.在第1个月返回第1列的相关数据。
result。loc[1,1]
将返回第1个月和第1列的一系列相关数据result.loc[(1,2),3]
返回第1个月第2列和第3列之间的相关性。有关切片具有多索引的数据帧的更多信息,请参阅。这正是我所要的。谢谢