Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/353.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何计算特征的比例分布';基于另一个功能创建类别_Python_Pandas_Distribution - Fatal编程技术网

Python 如何计算特征的比例分布';基于另一个功能创建类别

Python 如何计算特征的比例分布';基于另一个功能创建类别,python,pandas,distribution,Python,Pandas,Distribution,我正在使用UCI存储库中的,我希望计算收入>50k或pd.交叉表(成人满['income'],成人满['race'],normalize='columns')。plot.bar()。谢谢@QuangHoang,您如何按收入对他们进行分组和排序?(每个或每个种族的2个收入类别各有2列,例如按收入>50k排序)@QuangHoang谢谢你的指针,写下你的解决方案作为答案,我将标记为答案 ax = sns.countplot(x=adults_full['income'], hue=adults_fu

我正在使用UCI存储库中的,我希望计算收入>50k或
pd.交叉表(成人满['income'],成人满['race'],normalize='columns')。plot.bar()
。谢谢@QuangHoang,您如何按收入对他们进行分组和排序?(每个或每个种族的2个收入类别各有2列,例如按收入>50k排序)@QuangHoang谢谢你的指针,写下你的解决方案作为答案,我将标记为答案
ax = sns.countplot(x=adults_full['income'], hue=adults_full['race'], palette="pastel")
ax.set_xticklabels(['<50k', '>50k'])
ax.set_title('Income vs Race')
print(adults_full['race'].value_counts())
adults_full[['race', 'income']].value_counts()

White                 38903
Asian-Pac-Islander     1303

race                income
White               0         28696
                    1         10207
Asian-Pac-Islander  0           934
                    1           369
pivot = pd.crosstab(adults_full.race, adults_full.income, normalize='index')
pivot.sort_values(by = 1, inplace = True)
pivot.plot.bar()