Python中存储变量的有效方法_Python_Pandas

Python中存储变量的有效方法

python pandas

Python中存储变量的有效方法,python,pandas,Python,Pandas,全部, 我是python新手，尝试将数据分类到容器中假设，我有两列：年龄和购买。年龄是一个连续变量，购买是一个二元变量（1-是，0-否）。我想将年龄分类到各个箱子中，并查看每个箱子中的总购买数量我已经编写了以下代码，但我真诚地相信有更有效的方法来实现这一点。请检查以下内容并建议新方法或增强功能代码：谢谢你应该看看。还要考虑使用列表理解来创建标签： bins = [15, 30, 40, 50, 60, np.inf] labels = [f'{i}+' if j==np.inf els

全部,

我是python新手，尝试将数据分类到容器中

假设，我有两列：年龄和购买。年龄是一个连续变量，购买是一个二元变量（1-是，0-否）。我想将年龄分类到各个箱子中，并查看每个箱子中的总购买数量

我已经编写了以下代码，但我真诚地相信有更有效的方法来实现这一点。请检查以下内容并建议新方法或增强功能

代码：

谢谢

你应该看看。还要考虑使用列表理解来创建标签：

bins = [15, 30, 40, 50, 60, np.inf]
labels = [f'{i}+' if j==np.inf else f'{i}-{j}' for i, j in zip(bins, bins[1:])]

dataset['AgeRange'] = pd.cut(dataset['Age'], bins, labels)
dataset.groupby('AgeRange')['Purchased'].sum()

你不是在计算直方图吗？对二维直方图。谢谢

bins = [15, 30, 40, 50, 60, np.inf]
labels = [f'{i}+' if j==np.inf else f'{i}-{j}' for i, j in zip(bins, bins[1:])]

dataset['AgeRange'] = pd.cut(dataset['Age'], bins, labels)
dataset.groupby('AgeRange')['Purchased'].sum()