Python pd.cut是否没有重复的参数?

Python pd.cut是否没有重复的参数?,python,pandas,quantile,Python,Pandas,Quantile,当我尝试使用包含重复项的存储箱列表运行pd.cut时([0,0,0.2,0.4,0.6,0.8,1.]),它将返回以下内容: ValueError: Bin edges must be unique: array([0. , 0. , 0.2, 0.4, 0.6, 0.8, 1. ]). You can drop duplicate edges by setting the 'duplicates' kwarg 然而,当我添加duplicates='drop'(like可用于qcut)时,我得

当我尝试使用包含重复项的存储箱列表运行pd.cut时(
[0,0,0.2,0.4,0.6,0.8,1.]
),它将返回以下内容:

ValueError: Bin edges must be unique: array([0. , 0. , 0.2, 0.4, 0.6, 0.8, 1. ]).
You can drop duplicate edges by setting the 'duplicates' kwarg
然而,当我添加
duplicates='drop'
(like可用于qcut)时,我得到

最初的ValueError只是误导性的,因为duplicate并没有真正为cut实现,还是我做错了什么?我的版本是0.22。在调用pd.cut之前,我可以手动控制重复项,但如果存在,我希望使用现有的pandas功能

玩具数据/使用示例:

df = pd.DataFrame({"a":[0, 1, 0.18, 0.2, 0.38, 0.58, 0.78, 0.98]})
bad_bins = [0., 0., 0.2, 0.4, 0.6, 0.8, 1.0]
pd.cut(df['a'], bins=bad_bins)
pd.cut(df['a'], bins=bad_bins, duplicates='drop')

看起来你在用一个旧版本,因为这对我来说很好用。升级到0.23.Concurve with coldspeed这对我来说适用于
0.23.0
打印(pd.\uu版本)显示什么?您升级了不正确的位置,或者需要重新启动kernelMy bad-此容器位于0.22。Thnx。
df = pd.DataFrame({"a":[0, 1, 0.18, 0.2, 0.38, 0.58, 0.78, 0.98]})
bad_bins = [0., 0., 0.2, 0.4, 0.6, 0.8, 1.0]
pd.cut(df['a'], bins=bad_bins)
pd.cut(df['a'], bins=bad_bins, duplicates='drop')