Python中存储变量的有效方法

Python中存储变量的有效方法,python,pandas,Python,Pandas,全部, 我是python新手,尝试将数据分类到容器中 假设,我有两列:年龄和购买。年龄是一个连续变量,购买是一个二元变量(1-是,0-否)。我想将年龄分类到各个箱子中,并查看每个箱子中的总购买数量 我已经编写了以下代码,但我真诚地相信有更有效的方法来实现这一点。请检查以下内容并建议新方法或增强功能 代码: 谢谢 你应该看看。还要考虑使用列表理解来创建标签: bins = [15, 30, 40, 50, 60, np.inf] labels = [f'{i}+' if j==np.inf els

全部,

我是python新手,尝试将数据分类到容器中

假设,我有两列:年龄和购买。年龄是一个连续变量,购买是一个二元变量(1-是,0-否)。我想将年龄分类到各个箱子中,并查看每个箱子中的总购买数量

我已经编写了以下代码,但我真诚地相信有更有效的方法来实现这一点。请检查以下内容并建议新方法或增强功能

代码:

谢谢

你应该看看。还要考虑使用列表理解来创建标签:

bins = [15, 30, 40, 50, 60, np.inf]
labels = [f'{i}+' if j==np.inf else f'{i}-{j}' for i, j in zip(bins, bins[1:])]

dataset['AgeRange'] = pd.cut(dataset['Age'], bins, labels)
dataset.groupby('AgeRange')['Purchased'].sum()

你不是在计算直方图吗?对二维直方图。谢谢
bins = [15, 30, 40, 50, 60, np.inf]
labels = [f'{i}+' if j==np.inf else f'{i}-{j}' for i, j in zip(bins, bins[1:])]

dataset['AgeRange'] = pd.cut(dataset['Age'], bins, labels)
dataset.groupby('AgeRange')['Purchased'].sum()