R中的整群抽样

R中的整群抽样,r,cluster-analysis,cluster-computing,R,Cluster Analysis,Cluster Computing,我想了解这个脚本中发生了什么。为什么在整群抽样中需要平均值、标准差?在这个data.frame的上下文中,rnorm(200,mean=7,sd=1)的含义是什么 #make this example reproducible set.seed(1) #create data frame df <- data.frame(tour = rep(1:10, each=20), experience = rnorm(200, mean=7, sd=1)

我想了解这个脚本中发生了什么。为什么在整群抽样中需要平均值、标准差?在这个data.frame的上下文中,
rnorm(200,mean=7,sd=1)
的含义是什么

#make this example reproducible 
set.seed(1)  

#create data frame
df <- data.frame(tour = rep(1:10, each=20),
                 experience = rnorm(200, mean=7, sd=1))  

#view first six rows of data frame
head(df)  

#randomly choose 4 tour groups out of the 10
clusters <- sample(unique(df$tour), size=4, replace=F)
  
#define sample as all members who belong to one of the 4 tour groups
cluster_sample <- df[df$tour %in% clusters,]  

#view how many customers came from each tour
table(cluster_sample$tour) 
#使此示例重现
种子(1)
#创建数据帧

df使用
?rnorm
查看该功能的帮助页面。它根据具有给定平均值和标准偏差的正态分布创建随机抽取。