Python 3.x 如何获取已分组的df的特定属性
我正在打印每个州每十年的谋杀频率。然而,我只想打印国家,十年,以及受害者人数。我现在看到的是,它正在打印出所有频率相同的列。我如何改变它,使我只有3列,州,十年,和受害者计数 我目前正在使用groupby函数按状态和十年进行分组,并将其设置为一个名为count的变量Python 3.x 如何获取已分组的df的特定属性,python-3.x,pandas,Python 3.x,Pandas,我正在打印每个州每十年的谋杀频率。然而,我只想打印国家,十年,以及受害者人数。我现在看到的是,它正在打印出所有频率相同的列。我如何改变它,使我只有3列,州,十年,和受害者计数 我目前正在使用groupby函数按状态和十年进行分组,并将其设置为一个名为count的变量 xl = pd.ExcelFile('Wyoming.xlsx') df = xl.parse('Sheet1') df['Decade'] = (df['Year'] // 10) * 10 counts =
xl = pd.ExcelFile('Wyoming.xlsx')
df = xl.parse('Sheet1')
df['Decade'] = (df['Year'] // 10) * 10
counts = df.groupby(['State', 'Decade']).count()
print(counts)
结果是以相同的频率打印出文件中的所有列,而我只需要3列:State Decade牺牲品计数
选择所需的列:
counts = df.loc[:,['State', 'Decade','Vistim Count']].groupby(['State', 'Decade']).count()
或
您应该重置groupby对象的索引,然后从新数据框中选择列 差不多
xl = pd.ExcelFile('Wyoming.xlsx')
df = xl.parse('Sheet1')
df['Decade'] = (df['Year'] // 10) * 10
counts = df.groupby(['State', 'Decade']).count()
counts = counts.reset_index()[['State', 'Decade','Vistim Count']]
print(counts)
@你自己真棒。考虑支持/接受抱歉,我没有超过15的声誉来做这件事,因为我是一个比较新的堆栈溢出用户。如果你还有其他问题,请点击按钮,而不是编辑你当前的帖子。抱歉。不知道
xl = pd.ExcelFile('Wyoming.xlsx')
df = xl.parse('Sheet1')
df['Decade'] = (df['Year'] // 10) * 10
counts = df.groupby(['State', 'Decade']).count()
counts = counts.reset_index()[['State', 'Decade','Vistim Count']]
print(counts)