Pandas 按列选择值的平均值

Pandas 按列选择值的平均值,pandas,data-science,data-analysis,Pandas,Data Science,Data Analysis,我有一个数据集,其中有5列。考虑下面的数据库:-< /P> 城市 车辆 可乐 可乐 可乐 斋浦尔 汽车 ... ... ... 斋浦尔 汽车 ... ... ... 斋浦尔 自行车 ... ... ... 浦那 汽车 ... ... ... 孟买 自行车 ... ... ... ... ... ... ... ... 如果您希望使用col3(但仍分组在City下),请尝试以下操作: 这将为您提供所需的相对部分(总和为1),而不是实际计数。您也可以对其他列重复同样的操作。使用value\u计数(n

我有一个数据集,其中有5列。考虑下面的数据库:-< /P> 城市 车辆 可乐 可乐 可乐 斋浦尔 汽车 ... ... ... 斋浦尔 汽车 ... ... ... 斋浦尔 自行车 ... ... ... 浦那 汽车 ... ... ... 孟买 自行车 ... ... ... ... ... ... ... ...
如果您希望使用
col3
(但仍分组在
City
下),请尝试以下操作:


这将为您提供所需的相对部分(总和为1),而不是实际计数。您也可以对其他列重复同样的操作。

使用
value\u计数(normalize=True)
而不是
count()
?作为提示:
df.groupby(['City']])['Vehicle'].value\u计数(normalize=True)
。或者如果要计算col3,可以使用
df.groupby(['City'])['col3'].value\u计数(normalize=True)
(但仍归入城市)。正如问题标题所提到的列。因此,可能要计算每个列的各个值。OP需要对此进行澄清。@SeaBean感谢它的工作,它给了我我想要的答案。太好了!我已将建议作为答案发布在下面。请记住,如果您认为该建议对您有帮助。
df.groupby('City')['col3'].value_counts(normalize=True)