Python 如何计算具有相同索引的元素?
我必须从CSV文件中获取每个州的县数,然后返回哪个州的县数最多。但我不知道如何计算同一索引下的元素 csv文件: 我尝试使用.count()和numerate(),但返回了一个错误键错误:“Alabama” 这是我用来从CSV文件创建实际数据帧的代码Python 如何计算具有相同索引的元素?,python,pandas,Python,Pandas,我必须从CSV文件中获取每个州的县数,然后返回哪个州的县数最多。但我不知道如何计算同一索引下的元素 csv文件: 我尝试使用.count()和numerate(),但返回了一个错误键错误:“Alabama” 这是我用来从CSV文件创建实际数据帧的代码 import pandas as PD census = pd.read_csv('census.csv') counties = pd.DataFrame({'State':census['STNAME'],'County':census['
import pandas as PD
census = pd.read_csv('census.csv')
counties = pd.DataFrame({'State':census['STNAME'],'County':census['CTYNAME'],
'populations':census['CENSUS2010POP'],'population 2010': census['POPESTIMATE2010'],
'population 2015': census['POPESTIMATE2015']})
counties = counties.set_index(['State', 'County'])
尝试:
而不是:
你想知道每个州有多少个县?如果是这样的话,请执行以下操作:
countries.reset_index().groupby('State').size()
@Yuca您真的需要reset_index()
?不确定groupby在使用multtiindex时的实际行为,所以我选择了安全路线
counties.groupby(['State','County']).agg('count')
counties = counties.set_index(['State', 'County']).count()