Python 时间序列中协方差的计算

Python 时间序列中协方差的计算,python,pandas,time-series,covariance,Python,Pandas,Time Series,Covariance,如果在某个地方记录了此信息,但我未能找到,请提前道歉: 假设我有一个时间序列数据框,看起来像这样: WEEK_END_DATE TITLE_SHORT SALES 2012-02-25 00:00:00.000000 "Bob" (EBK) 1 2012-03-31 00:00:00.000000 "Bob" (EBK) 1 2012-03-03 00:00:00.000000 "Sally" (EBK)

如果在某个地方记录了此信息,但我未能找到,请提前道歉:

假设我有一个时间序列数据框,看起来像这样:

WEEK_END_DATE              TITLE_SHORT          SALES  
2012-02-25 00:00:00.000000 "Bob" (EBK)            1
2012-03-31 00:00:00.000000 "Bob" (EBK)            1
2012-03-03 00:00:00.000000 "Sally" (EBK)          1
2012-03-10 00:00:00.000000 "Sally" (EBK)          1
2012-03-17 00:00:00.000000 "Sally" (EBK)          1
2012-04-07 00:00:00.000000 "Sally" (EBK)          1
我想计算销售中的协方差,以便找到倾向于一起移动的用户。我知道熊猫有一个协方差特性:,但我不确定如何为这种目的重塑我的数据


我是否正确地认为需要将用户设置为列索引,以便每个序列都是时间序列中的向量?我不知道怎么做。

你在找熊猫。首先要做:

df.pivot(index='WEEK_END_DATE', columns='TITLE_SHORT', values='SALES')

你应该让鲍勃和莎莉当专栏。然后,您可以对这两列进行正常的相关性分析。

Pivot不太正确,但它起到了作用:

df = pd.pivot_table(df, rows='WEEK_END_DATE', cols='TITLE_SHORT', values='SALES', aggfunc="sum")

我不知道有什么区别。

你的“一起行动”是什么意思?这是不是意味着在同一个“周末”去?我认为“一起移动”的意思是他们“共同变化”,即OP使用协方差作为相关性的度量(而不是实际计算相关性)。这意味着Sally和Bob购买的总体形状是相同的。另一个例子是股票——谷歌股票往往会一起上扬或下挫,与苹果股票相比,与通用电气的对应性更强。谢谢!我不知道我怎么忘记了透视表