Python 对pandas中的groupby函数很好奇,如何为通用数据集编写groupby?
我想为groupby编写一个通用函数,假设我有一个数据集,它大约有100列,例如它有70个分类列,30个数值属性,现在我想编写一个通用python函数,它将只获取数据集,并以绘图或数据的形式显示相应的groupby结果,在我开始之前有什么专家建议吗 谢谢,Python 对pandas中的groupby函数很好奇,如何为通用数据集编写groupby?,python,pandas,group-by,pandas-groupby,Python,Pandas,Group By,Pandas Groupby,我想为groupby编写一个通用函数,假设我有一个数据集,它大约有100列,例如它有70个分类列,30个数值属性,现在我想编写一个通用python函数,它将只获取数据集,并以绘图或数据的形式显示相应的groupby结果,在我开始之前有什么专家建议吗 谢谢, Shivam您可以合并标准库中的随机模块,以获得所有数字列的随机样本 df = pd.DataFrame({ 'a': list('abcde'), 'b': ['1','2','3','4','5'],
Shivam您可以合并标准库中的随机模块,以获得所有数字列的随机样本
df = pd.DataFrame({
'a': list('abcde'),
'b': ['1','2','3','4','5'],
'c': range(5),
'd': [i*21 for i in range(5)],
'e': [12,32,45,67,54]})
str_cols = df.select_dtypes(exclude='number').columns.tolist()
num_cols = random.sample(df.select_dtypes('number').columns.tolist(), k=2)
dff = df.loc[:, str_cols+num_cols]
print(dff)
a b d c
0 a 1 0 0
1 b 2 21 1
2 c 3 42 2
3 d 4 63 3
4 e 5 84 4
Python的禅宗思想之一是:“显式优于隐式”。Groupby无法神奇地预测你想要什么,也不应该如此,因为它已经是通用的了。是的,我基本上同意你的观点,但不管怎样,我只是想把它随机分类,并将至少10个数字属性分组。是的,正是这样,我现在正在计划,因为我不能一次性将所有类别分组,但至少5个或10个样本会很好地展示出来。谢谢你的回复