Python 如何为pandas.cut函数定义(并命名)间隔?
我想将Python 如何为pandas.cut函数定义(并命名)间隔?,python,pandas,intervals,Python,Pandas,Intervals,我想将pandas.cut()函数与定义的间隔结合使用,以这些间隔对给定数据进行排序。我还想给这些区间起个名字,比如:小、中、高。 我已尝试使用以下代码执行此操作: 将熊猫作为pd导入 CO_simplified=pd.IntervalIndex.from_tuples([(02000)、(200250)、(3001000)])#小、中、高 df_dtc_test=pd.DataFrame() df_dtc_测试[“CO_simp”]=局部切割([122232333324533],透镜(CO_简
pandas.cut()
函数与定义的间隔结合使用,以这些间隔对给定数据进行排序。我还想给这些区间起个名字,比如:小、中、高。
我已尝试使用以下代码执行此操作:
将熊猫作为pd导入
CO_simplified=pd.IntervalIndex.from_tuples([(02000)、(200250)、(3001000)])#小、中、高
df_dtc_test=pd.DataFrame()
df_dtc_测试[“CO_simp”]=局部切割([122232333324533],透镜(CO_简化),标签=CO_简化)
打印(df\U dtc\U测试)
输出:
CO_simp
0 (0, 200]
1 (0, 200]
2 (200, 250]
3 (200, 250]
4 (300, 1000]
但这并不是我所期望的,第一个索引号对我来说似乎是正确的,但第二个索引号也在组(0200)中排序,但第二个索引的给定值是232,超出了这个间隔。除了错误的排序之外,我想用“small”替换例如(0200)
编辑:我的问题部分解决了(见下文),我唯一关心的是如何用名称替换间隔
有人知道我如何正确地完成这项工作吗?订购正确的方式: 使用 而不是
df_dtc_test["CO_simp"] = pd.cut([122,232,333,324,533], len(CO_simplified), labels=CO_simplified)
df_dtc_test[“CO_simp”]=pd.cut([122232333324533],CO_简化,labels=CO_简化)
Ah这很有意义。。。非常感谢你的敏锐!关于命名:检查帖子。
df_dtc_test["CO_simp"] = pd.cut([122,232,333,324,533], len(CO_simplified), labels=CO_simplified)