Python 熊猫:如何从dataframe中的特定列中获取每个类别的样本行并保存在单个csv中?
下面是数据帧(df)。我想从“国家”列的每个类别中保存3行样本。 以下是我的代码,但它不是基于类别保存的。我需要样品。请建议Python 熊猫:如何从dataframe中的特定列中获取每个类别的样本行并保存在单个csv中?,python,pandas,Python,Pandas,下面是数据帧(df)。我想从“国家”列的每个类别中保存3行样本。 以下是我的代码,但它不是基于类别保存的。我需要样品。请建议 data = {'country':['India', 'Nepal', 'Canada', 'USA','India', 'Nepal', 'Canada', 'USA','India', 'Nepal', 'Canada', 'USA','India', 'Nepal', 'Canada', 'USA','India', 'Nepal', 'Canada', 'USA
data = {'country':['India', 'Nepal', 'Canada', 'USA','India', 'Nepal', 'Canada', 'USA','India', 'Nepal', 'Canada', 'USA','India', 'Nepal', 'Canada', 'USA','India', 'Nepal', 'Canada', 'USA'],
'Age':[20, 21, 19, 18,20, 21, 19, 18,20, 21, 19, 18,20, 21, 19, 18,20, 21, 19, 18]}
df = pd.DataFrame(data)
df.sample(n=3).to_csv(sampledata.csv, na_rep='NA', index = False)
分组,然后取样
df.groupby('country').sample(3)
country Age
2 Canada 19
6 Canada 19
10 Canada 19
4 India 20
0 India 20
12 India 20
1 Nepal 21
13 Nepal 21
9 Nepal 21
3 USA 18
11 USA 18
19 USA 18
获取以下错误:AttributeError:无法访问“DataFrameGroupBy”对象的可调用属性“sample”,请尝试使用“apply”方法您使用的熊猫是什么版本的
df.groupby.sample
是在pandas 1.1及更高版本中添加的。我使用的版本是3.7version@John83这就是python版本。您使用的熊猫是什么版本的:pd.\uuuu version\uuuu
这是一个..'0.25.1'