Pandas 如何使用来自另一个数据帧的分组输出创建新的数据帧？_Pandas

Pandas 如何使用来自另一个数据帧的分组输出创建新的数据帧？

pandas

Pandas 如何使用来自另一个数据帧的分组输出创建新的数据帧？,pandas,Pandas,我有包含符号、出价和要价的勾号数据。我能够找到每个符号的平均排列和标准偏差我想为每个符号创建一个置信区间，并让最终的数据帧输出包含列股票代码平均价差下限95%置信度上界95%置信度我该怎么做？这就是我能做到的程度： df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv', dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice

我有包含符号、出价和要价的勾号数据。我能够找到每个符号的平均排列和标准偏差

我想为每个符号创建一个置信区间，并让最终的数据帧输出包含列

股票代码
平均价差
下限95%置信度
上界95%置信度

我该怎么做？这就是我能做到的程度：

df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv',
                 dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice': np.float64, 'afterHours': str},
                 usecols=['ticker', 'bidPrice', 'askPrice', 'afterHours'],
                 nrows=3000000
                 )

df = df[df.afterHours == "False"]
df = df[df.bidPrice != 0]
df = df[df.askPrice != 0]
df['spread'] = (df.askPrice - df.bidPrice)

print(df.groupby(['ticker'])['spread'].mean())
print(df.groupby(['ticker'])['spread'].std(ddof=0) * 1.96)

只要打电话给pd.dataframe就可以了

new\u df=pd.dataframe（df.groupby（['ticker']）['spread'].mean（））

嘿！我如何向其中添加第二列以包含标准偏差计算，并使其与ticker匹配？我想这正是让我困惑的地方，在那之后，我将直接创建一个第三和第四列，其中包含股票代码上的intervaluse pd.merge。how=“left”、left\u on='ticker'等。