Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/67.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 将70%的数据采样到新的数据帧中_R - Fatal编程技术网

R 将70%的数据采样到新的数据帧中

R 将70%的数据采样到新的数据帧中,r,R,我一定是做错了什么。我正在尝试创建一个新的数据帧,随机抽样我的主数据帧的70%——carsdata set.seed(80915974) my.sample.70=carsdata[sample(carsdata)*.7, replace = TRUE] 我们可以使用切片样品 使用可复制的示例 mtcars %>% slice_sample(prop = 0.7) # mpg cyl disp hp drat wt qsec

我一定是做错了什么。我正在尝试创建一个新的数据帧,随机抽样我的主数据帧的70%——carsdata

set.seed(80915974)
my.sample.70=carsdata[sample(carsdata)*.7, replace = TRUE]
我们可以使用切片样品

使用可复制的示例

mtcars %>%  
    slice_sample(prop = 0.7)
#                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
#Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
#Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
#Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
#Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
#Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
#Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
#Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
#Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
#Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
#Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
#Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
#Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
#Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
#Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
#Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
#Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
#Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
#Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
#Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
#AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
#Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
#Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
我们可以使用切片样品

使用可复制的示例

mtcars %>%  
    slice_sample(prop = 0.7)
#                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
#Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
#Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
#Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
#Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
#Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
#Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
#Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
#Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
#Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
#Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
#Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
#Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
#Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
#Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
#Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
#Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
#Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
#Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
#Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
#AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
#Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
#Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4

使用子集+样本的另一个基本R选项


使用子集+样本的另一个基本R选项


是的,我明白了。非常感谢。我使用了基本的R,它工作得很好。@akrun。简单有效的方法与基地R!但是值得注意的是,这种方法可能不会创建随机样本,因为选择仅限于前70%的行-可能会引入样本偏差。@Pittoro是对的,应该是SampleRowCarsData,nrowcarsdata*0.7,对整个数据帧的70%进行采样,不重复。是的,我明白了。非常感谢。我使用了基本的R,它工作得很好。@akrun。简单有效的方法与基地R!但值得注意的是,这种方法可能不会创建随机样本,因为选择仅限于前70%的行-可能会引入样本偏差。@Pittoro是对的,应该是SampleRowCarsData,nrowcarsdata*0.7,对整个数据帧的70%进行采样,不重复。
mtcars %>%  
    slice_sample(prop = 0.7)
#                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
#Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
#Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
#Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
#Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
#Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
#Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
#Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
#Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
#Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
#Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
#Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
#Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
#Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
#Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
#Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
#Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
#Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
#Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
#Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
#AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
#Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
#Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
subset(carsdata,sample(c(TRUE, FALSE), nrow(carsdata), replace = TRUE, prob = c(0.7, 0.3)))