Pandas 如何使用来自另一个数据帧的分组输出创建新的数据帧?

Pandas 如何使用来自另一个数据帧的分组输出创建新的数据帧?,pandas,Pandas,我有包含符号、出价和要价的勾号数据。我能够找到每个符号的平均排列和标准偏差 我想为每个符号创建一个置信区间,并让最终的数据帧输出包含列 股票代码 平均价差 下限95%置信度 上界95%置信度 我该怎么做?这就是我能做到的程度: df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv', dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice

我有包含符号、出价和要价的勾号数据。我能够找到每个符号的平均排列和标准偏差

我想为每个符号创建一个置信区间,并让最终的数据帧输出包含列

  • 股票代码
  • 平均价差
  • 下限95%置信度
  • 上界95%置信度
我该怎么做?这就是我能做到的程度:

df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv',
                 dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice': np.float64, 'afterHours': str},
                 usecols=['ticker', 'bidPrice', 'askPrice', 'afterHours'],
                 nrows=3000000
                 )

df = df[df.afterHours == "False"]
df = df[df.bidPrice != 0]
df = df[df.askPrice != 0]
df['spread'] = (df.askPrice - df.bidPrice)

print(df.groupby(['ticker'])['spread'].mean())
print(df.groupby(['ticker'])['spread'].std(ddof=0) * 1.96)

只要打电话给pd.dataframe就可以了

new\u df=pd.dataframe(df.groupby(['ticker'])['spread'].mean())

嘿!我如何向其中添加第二列以包含标准偏差计算,并使其与ticker匹配?我想这正是让我困惑的地方,在那之后,我将直接创建一个第三和第四列,其中包含股票代码上的intervaluse pd.merge。how=“left”、left\u on='ticker'等。