在指定开始行和结束行编号后,从Python中的dataframe/csv文件中选择随机行(数据)?
使用在指定开始行和结束行编号后,从Python中的dataframe/csv文件中选择随机行(数据)?,python,random,rows,Python,Random,Rows,使用sample()函数,我可以获得随机行。数据集有1000000行数据,我希望有20000行的子集。可以通过此解决方案导入随机线 读取数据集 dataset\u sub=dataset.sample(20000,随机状态=1) 但是,我想在行号250000到750000之间随机选择行。在这方面有什么可能的解决方案吗?我认为您需要: dataset = read_csv(file_path) dataset_sub = dataset.sample(random.randint(250000,
sample()
函数,我可以获得随机行。数据集有1000000行
数据,我希望有20000行的子集。可以通过此解决方案导入随机线
读取数据集
dataset\u sub=dataset.sample(20000,随机状态=1)
但是,我想在行号250000
到750000
之间随机选择行。在这方面有什么可能的解决方案吗?我认为您需要:
dataset = read_csv(file_path)
dataset_sub = dataset.sample(random.randint(250000,750000), random_state=1)
您可以做的是创建一个数据框,其中包含行数250000到750000之间的行,然后从中随机选择20000行
dataset_sub = dataset.loc[250000:750000].sample(20000, random_state=1)
我认为以下代码有效:
import random
a=random.sample(range(250000,750000), 20000)
data=dataset.loc[a]
谢谢你的回复,但我只想随机抽取20000行。我认为这个论点也应该被加入。谢谢,这是有帮助的
import random
a=random.sample(range(250000,750000), 20000)
data=dataset.loc[a]