Python 如何计算特征的比例分布';基于另一个功能创建类别
我正在使用UCI存储库中的,我希望计算收入>50k或Python 如何计算特征的比例分布';基于另一个功能创建类别,python,pandas,distribution,Python,Pandas,Distribution,我正在使用UCI存储库中的,我希望计算收入>50k或pd.交叉表(成人满['income'],成人满['race'],normalize='columns')。plot.bar()。谢谢@QuangHoang,您如何按收入对他们进行分组和排序?(每个或每个种族的2个收入类别各有2列,例如按收入>50k排序)@QuangHoang谢谢你的指针,写下你的解决方案作为答案,我将标记为答案 ax = sns.countplot(x=adults_full['income'], hue=adults_fu
pd.交叉表(成人满['income'],成人满['race'],normalize='columns')。plot.bar()
。谢谢@QuangHoang,您如何按收入对他们进行分组和排序?(每个或每个种族的2个收入类别各有2列,例如按收入>50k排序)@QuangHoang谢谢你的指针,写下你的解决方案作为答案,我将标记为答案
ax = sns.countplot(x=adults_full['income'], hue=adults_full['race'], palette="pastel")
ax.set_xticklabels(['<50k', '>50k'])
ax.set_title('Income vs Race')
print(adults_full['race'].value_counts())
adults_full[['race', 'income']].value_counts()
White 38903
Asian-Pac-Islander 1303
race income
White 0 28696
1 10207
Asian-Pac-Islander 0 934
1 369
pivot = pd.crosstab(adults_full.race, adults_full.income, normalize='index')
pivot.sort_values(by = 1, inplace = True)
pivot.plot.bar()