在指定开始行和结束行编号后,从Python中的dataframe/csv文件中选择随机行(数据)?

在指定开始行和结束行编号后,从Python中的dataframe/csv文件中选择随机行(数据)?,python,random,rows,Python,Random,Rows,使用sample()函数,我可以获得随机行。数据集有1000000行数据,我希望有20000行的子集。可以通过此解决方案导入随机线 读取数据集 dataset\u sub=dataset.sample(20000,随机状态=1) 但是,我想在行号250000到750000之间随机选择行。在这方面有什么可能的解决方案吗?我认为您需要: dataset = read_csv(file_path) dataset_sub = dataset.sample(random.randint(250000,

使用
sample()
函数,我可以获得随机行。数据集有
1000000行
数据,我希望有
20000行的子集。可以通过此解决方案导入随机线

读取数据集 dataset\u sub=dataset.sample(20000,随机状态=1)

但是,我想在行号
250000
750000
之间随机选择行。在这方面有什么可能的解决方案吗?

我认为您需要:

dataset = read_csv(file_path)
dataset_sub = dataset.sample(random.randint(250000,750000), random_state=1)

您可以做的是创建一个数据框,其中包含行数250000到750000之间的行,然后从中随机选择20000行

dataset_sub = dataset.loc[250000:750000].sample(20000, random_state=1)

我认为以下代码有效:

import random
a=random.sample(range(250000,750000), 20000)
data=dataset.loc[a]

谢谢你的回复,但我只想随机抽取20000行。我认为这个论点也应该被加入。谢谢,这是有帮助的
import random
a=random.sample(range(250000,750000), 20000)
data=dataset.loc[a]