Python 如何为pandas.cut函数定义（并命名）间隔？_Python_Pandas_Intervals

Python 如何为pandas.cut函数定义（并命名）间隔？

python pandas

Python 如何为pandas.cut函数定义（并命名）间隔？,python,pandas,intervals,Python,Pandas,Intervals,我想将pandas.cut（）函数与定义的间隔结合使用，以这些间隔对给定数据进行排序。我还想给这些区间起个名字，比如：小、中、高。我已尝试使用以下代码执行此操作：将熊猫作为pd导入 CO_simplified=pd.IntervalIndex.from_tuples（[（02000）、（200250）、（3001000）]）#小、中、高 df_dtc_test=pd.DataFrame（） df_dtc_测试[“CO_simp”]=局部切割（[122232333324533]，透镜（CO_简

我想将

pandas.cut（）

函数与定义的间隔结合使用，以这些间隔对给定数据进行排序。我还想给这些区间起个名字，比如：小、中、高。我已尝试使用以下代码执行此操作：

将熊猫作为pd导入
CO_simplified=pd.IntervalIndex.from_tuples（[（02000）、（200250）、（3001000）]）#小、中、高
df_dtc_test=pd.DataFrame（）
df_dtc_测试[“CO_simp”]=局部切割（[122232333324533]，透镜（CO_简化），标签=CO_简化）
打印（df\U dtc\U测试）

输出：

       CO_simp
0     (0, 200]
1     (0, 200]
2   (200, 250]
3   (200, 250]
4  (300, 1000]

但这并不是我所期望的，第一个索引号对我来说似乎是正确的，但第二个索引号也在组（0200）中排序，但第二个索引的给定值是232，超出了这个间隔。除了错误的排序之外，我想用“small”替换例如（0200）

编辑：我的问题部分解决了（见下文），我唯一关心的是如何用名称替换间隔

有人知道我如何正确地完成这项工作吗？

订购正确的方式：

使用

而不是

df_dtc_test["CO_simp"] = pd.cut([122,232,333,324,533], len(CO_simplified), labels=CO_simplified)

df_dtc_test[“CO_simp”]=pd.cut（[122232333324533]，CO_简化，labels=CO_简化）

Ah这很有意义。。。非常感谢你的敏锐！关于命名：检查帖子。

df_dtc_test["CO_simp"] = pd.cut([122,232,333,324,533], len(CO_simplified), labels=CO_simplified)