从pandas.cut隐藏标签自定义间隔索引

从pandas.cut隐藏标签自定义间隔索引,pandas,Pandas,我申请了熊猫系列。如果我不使用自定义的间隔索引,label=False将按预期工作(仅返回箱子的整数指示器)。然而,当我使用定制的间隔索引时,即使我设置了label=False,它也会返回每个箱子的间隔。我猜这可能是因为我使用了区间索引而不是箱子的数量 是否可以使用定制的间隔索引,也可以只返回箱子的整数指示器 bins = pd.interval_range(start=0, end=10, periods=5, closed='left') pd.cut([1, 3, 5, 7, 9], bi

我申请了熊猫系列。如果我不使用自定义的间隔索引,
label=False
将按预期工作(仅返回箱子的整数指示器)。然而,当我使用定制的间隔索引时,即使我设置了
label=False
,它也会返回每个箱子的间隔。我猜这可能是因为我使用了区间索引而不是箱子的数量

是否可以使用定制的间隔索引,也可以只返回箱子的整数指示器

bins = pd.interval_range(start=0, end=10, periods=5, closed='left')
pd.cut([1, 3, 5, 7, 9], bins, labels=False)
代码
属性
pd.cut
函数返回一个
category
type对象。显示的是每个元素的各种类别。但是,
category
对象有两个属性
code
categories
类别是您所想的。它是一个按正确顺序排列的独特类别数组。
code
categorial
对象的每个元素所引用的
categories
数组的位置

通过使用
code
数组对
categories
数组进行切片,可以生成
Categorical
值,如下所示:

mycut = pd.cut([1, 3, 5, 7, 9], bins, labels=False)

mycut.categories[mycut.codes]

IntervalIndex([[0, 2), [2, 4), [4, 6), [6, 8), [8, 10)],
              closed='left',
              dtype='interval[int64]')

然而,
代码
正是您要寻找的东西。。。那就拿去吧。

谢谢!你能解释一下代码属性的作用吗?我用谷歌搜索了一下,但没找到有用的information@Osca我用更多的解释更新了我的答案。
mycut = pd.cut([1, 3, 5, 7, 9], bins, labels=False)

mycut.categories[mycut.codes]

IntervalIndex([[0, 2), [2, 4), [4, 6), [6, 8), [8, 10)],
              closed='left',
              dtype='interval[int64]')