Python 按整数值显示数据帧
我有一个pandas数据框,我想通过单个列的值来存储数据。例如,0-1、1-2等,从0开始到1结束,间隔为0.1,取每个箱子内每列的平均值 我正试图使用pandas的.groupby功能来实现这一点。请参见下面的我的代码:Python 按整数值显示数据帧,python,pandas,Python,Pandas,我有一个pandas数据框,我想通过单个列的值来存储数据。例如,0-1、1-2等,从0开始到1结束,间隔为0.1,取每个箱子内每列的平均值 我正试图使用pandas的.groupby功能来实现这一点。请参见下面的我的代码: import pandas as pd import numpy as np my_df = pd.DataFrame({"a": np.random.random(100), "b": np.random.random(100)
import pandas as pd
import numpy as np
my_df = pd.DataFrame({"a": np.random.random(100),
"b": np.random.random(100),
"id": np.arange(100)})
bins = np.linspace(0, 1, 0.1)
groups = my_df.groupby(np.digitize(my_df.a, bins))
binned_data = groups.mean()
print binned_data
然后,打印行给出一个索引为“1”的单行,即使列“a”的数据应具有指定的存储箱的值范围
我认为创建“垃圾箱”有问题,但我不知道是什么问题
我希望以0.1的间隔将10行从0分到1。我怎样才能做到这一点
非常感谢。最后一个参数,
bins=np.linspace(0,1,10)
不是0.1
。啊,我这是小学生的误解。非常感谢。