R数据集中的随机行样本

R数据集中的随机行样本,r,dataframe,sampling,R,Dataframe,Sampling,假设我有一个90000 x 17的数据集,即n x p,其中n是观察值的数量,p是变量的数量,我想从我的整个数据集中随机抽取20%的行,如何在R中做到这一点 在随机抽取样本后,我将进行相应的聚类分析 我曾尝试使用其他问题来回答我的问题,但这些问题没有得出结论,因为它没有提供我所需要的信息。您可以使用dplyr的sample_frac来完成,下面是一个数据库iris的示例 library(dplyr) #data(iris) sample20 <- iris %>% sample

假设我有一个90000 x 17的数据集,即n x p,其中n是观察值的数量,p是变量的数量,我想从我的整个数据集中随机抽取20%的行,如何在R中做到这一点

在随机抽取样本后,我将进行相应的聚类分析

我曾尝试使用其他问题来回答我的问题,但这些问题没有得出结论,因为它没有提供我所需要的信息。

您可以使用dplyr的sample_frac来完成,下面是一个数据库iris的示例

 library(dplyr)
 #data(iris)
 sample20 <- iris %>% sample_frac(0.2)
重复采样的样本可能有助于DF[samplenrowdf,nrowdf*0.2,]记住固定seed set.seed1492或任何数字,以获得样本的再现性!