Python 如何为pandas.cut函数定义(并命名)间隔?

Python 如何为pandas.cut函数定义(并命名)间隔?,python,pandas,intervals,Python,Pandas,Intervals,我想将pandas.cut()函数与定义的间隔结合使用,以这些间隔对给定数据进行排序。我还想给这些区间起个名字,比如:小、中、高。 我已尝试使用以下代码执行此操作: 将熊猫作为pd导入 CO_simplified=pd.IntervalIndex.from_tuples([(02000)、(200250)、(3001000)])#小、中、高 df_dtc_test=pd.DataFrame() df_dtc_测试[“CO_simp”]=局部切割([122232333324533],透镜(CO_简

我想将
pandas.cut()
函数与定义的间隔结合使用,以这些间隔对给定数据进行排序。我还想给这些区间起个名字,比如:小、中、高。 我已尝试使用以下代码执行此操作:

将熊猫作为pd导入
CO_simplified=pd.IntervalIndex.from_tuples([(02000)、(200250)、(3001000)])#小、中、高
df_dtc_test=pd.DataFrame()
df_dtc_测试[“CO_simp”]=局部切割([122232333324533],透镜(CO_简化),标签=CO_简化)
打印(df\U dtc\U测试)
输出:

       CO_simp
0     (0, 200]
1     (0, 200]
2   (200, 250]
3   (200, 250]
4  (300, 1000]
但这并不是我所期望的,第一个索引号对我来说似乎是正确的,但第二个索引号也在组(0200)中排序,但第二个索引的给定值是232,超出了这个间隔。除了错误的排序之外,我想用“small”替换例如(0200)

编辑:我的问题部分解决了(见下文),我唯一关心的是如何用名称替换间隔


有人知道我如何正确地完成这项工作吗?

订购正确的方式:

使用

而不是

df_dtc_test["CO_simp"] = pd.cut([122,232,333,324,533], len(CO_simplified), labels=CO_simplified)

df_dtc_test[“CO_simp”]=pd.cut([122232333324533],CO_简化,labels=CO_简化)
Ah这很有意义。。。非常感谢你的敏锐!关于命名:检查帖子。
df_dtc_test["CO_simp"] = pd.cut([122,232,333,324,533], len(CO_simplified), labels=CO_simplified)