Python 统计摘要循环中未定义Col变量
我一直在为数据帧(df3)中的每一列创建一个统计摘要的循环中苦苦挣扎。理想情况下,循环是将每列摘要数据作为一列附加到新的数据帧中。以下是我的数据示例:Python 统计摘要循环中未定义Col变量,python,pandas,loops,summary,Python,Pandas,Loops,Summary,我一直在为数据帧(df3)中的每一列创建一个统计摘要的循环中苦苦挣扎。理想情况下,循环是将每列摘要数据作为一列附加到新的数据帧中。以下是我的数据示例: DJI Price Open Close High Low Difference \ Date 1/2/2020 28638.97 28868.80
DJI Price Open Close High Low Difference \
Date
1/2/2020 28638.97 28868.80 28872.80 28627.77 245.03
1/3/2020 28553.33 28634.88 28716.31 28500.36 215.95
1/6/2020 28465.50 28703.38 28708.02 28418.63 289.39
1/7/2020 28639.18 28583.68 28685.50 28565.28 120.22
1/8/2020 28556.14 28745.09 28866.18 28522.51 343.67
Price Difference Price Range Y/N Event? Volume AHT Loss?
Date
1/2/2020 49.9424 Low 1 2.5182 1
1/3/2020 44.0153 Low 0 2.3959 1
1/6/2020 58.9834 Low 0 2.5276 1
1/7/2020 24.5034 Low 1 2.5890 1
1/8/2020 70.0470 Medium 0 2.9175 0
这是我的断环。我不确定如何/是否可以将col定义为表示每个数据帧列的变量,然后测试该col是否是要汇总并附加到新df:Sumry末尾的列
# Summary loops
colheads = df3.columns
col = colheads.columns
Sumry = []
for col in colheads:
Sumry.append(df3.query('col == True')['summary'].mean())
return
只是
df3.description(include='all')
不适合你吗?如果您为您的示例提供预期的输出,我会很有帮助。无论如何,col=colheads.columns
应该会失败,因为“'Index'对象没有属性'columns'”,而这个df3.query('col==True')
应该替换为df.query(f'{col}==True')
,以便工作。