Pandas 如何使用来自另一个数据帧的分组输出创建新的数据帧?
我有包含符号、出价和要价的勾号数据。我能够找到每个符号的平均排列和标准偏差 我想为每个符号创建一个置信区间,并让最终的数据帧输出包含列Pandas 如何使用来自另一个数据帧的分组输出创建新的数据帧?,pandas,Pandas,我有包含符号、出价和要价的勾号数据。我能够找到每个符号的平均排列和标准偏差 我想为每个符号创建一个置信区间,并让最终的数据帧输出包含列 股票代码 平均价差 下限95%置信度 上界95%置信度 我该怎么做?这就是我能做到的程度: df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv', dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice
- 股票代码
- 平均价差
- 下限95%置信度
- 上界95%置信度
df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv',
dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice': np.float64, 'afterHours': str},
usecols=['ticker', 'bidPrice', 'askPrice', 'afterHours'],
nrows=3000000
)
df = df[df.afterHours == "False"]
df = df[df.bidPrice != 0]
df = df[df.askPrice != 0]
df['spread'] = (df.askPrice - df.bidPrice)
print(df.groupby(['ticker'])['spread'].mean())
print(df.groupby(['ticker'])['spread'].std(ddof=0) * 1.96)
只要打电话给pd.dataframe就可以了
new\u df=pd.dataframe(df.groupby(['ticker'])['spread'].mean())
嘿!我如何向其中添加第二列以包含标准偏差计算,并使其与ticker匹配?我想这正是让我困惑的地方,在那之后,我将直接创建一个第三和第四列,其中包含股票代码上的intervaluse pd.merge。how=“left”、left\u on='ticker'等。