在R中创建培训和测试数据集_R_Subset_Training Data - Fatal编程技术网

在R中创建培训和测试数据集

r

在R中创建培训和测试数据集,r,subset,training-data,R,Subset,Training Data,我想从mydata中创建训练和测试数据，它有2673个观察值和23个变量。然而，我不能仅仅通过减去训练数据来创建测试集 dim(mydata) ## [1] 2673 23 set.seed(1) train = mydata[sample(1:nrow(mydata), 1000, replace=FALSE), ] dim(train) ## [1] 1000 23 运行以下命令时，我收到19条警告，结果有20062条观察结果： test = mydata[!train, ] ##

我想从

mydata

中创建训练和测试数据，它有2673个观察值和23个变量。然而，我不能仅仅通过减去训练数据来创建测试集

dim(mydata)
## [1] 2673   23
set.seed(1)
train = mydata[sample(1:nrow(mydata), 1000, replace=FALSE), ]
dim(train)
## [1] 1000   23

运行以下命令时，我收到19条警告，结果有20062条观察结果：

test = mydata[!train, ]
## There were 19 warnings (use warnings() to see them)
dim(test)
## [1] 20062    23

我做错了什么？

一个可能的解决方案是将采样的索引存储在一个单独的命名向量中

train_idx <- sample(1:nrow(mydata),1000,replace=FALSE)
train <- mydata[train_idx,] # select all these rows
test <- mydata[-train_idx,] # select all but these rows

但是第二种解决方案在

mydata上慢了2倍。一种可能的解决方案是将采样的索引存储在一个单独的命名向量中
train_idx <- sample(1:nrow(mydata),1000,replace=FALSE)
train <- mydata[train_idx,] # select all these rows
test <- mydata[-train_idx,] # select all but these rows

但是第二个解决方案在mydata上慢了2倍，谢谢！在创建train\u idx
之前，我仍然需要设置种子。是否正确？如果希望获得可复制的结果，请在sample（）之前调用set.seed（一些编号）
。如果这对你不重要，保持种子不变（它是根据系统时间+一些其他信息自动设置的）。谢谢！在创建train\u idx
之前，我仍然需要设置种子。是否正确？如果希望获得可复制的结果，请在sample（）之前调用set.seed（一些编号）
。如果这对您不重要，请保持种子不变（它会根据系统时间+一些其他信息自动设置）。此处相关




[phantomjs]相关文章推荐



                                                        
从PhantomJS调用到injectJS公开变量
phantomjs 
Phantomjs 无法加载url，然后无法发送登录参数
phantomjs 
Phantomjs 幻影
phantomjs 
PhantomJS在模拟管理员用户时不会运行
phantomjs 
Phantomjs 如何在每次测试之间完全隔离和清除环境？
phantomjs 
grunt mocha:PhantomJS超时，可能是由于缺少mocha run（）调用
phantomjs 
Phantomjs 如何获取呈现页面的纯文本版本？
phantomjs 
                                       





随机文章推荐



                                                        
当php设置为Log to syslog时，记录REQUEST_URI变量
phpcmodule 
Php 我该如何改变；“日期字段”；a"；“视图”；以Drupal中的页面形式？
phpdrupaldrupal-6view 
php中的嵌套类
phpoopclass 
Php 如何调试内存不足问题
php 
Php Wordpress-将标签添加为类？（博士后班）
phphtmlwordpresstags 
Php mysqli准备了一份声明
php 
Php 多维数组？基于同一数组中的值在项目上切换颜色（在数组中）
phpjavascript 
删除Codeigniter 2中的index.php
php.htaccesscodeignitermod-rewrite 
Php 如何使用foreach和if语句只验证一次用户更新数据库表
php 
Php 将Datetime类格式化为'；2013-08-05T10:00:00'；
phpdatetime 
Php 检查数组字段是否为空并打印警告消息
php 
PHP日期格式：符号%s
phpdate 
尝试修复非对象错误PHP twitter Xampp的属性
phpnetbeanstwitterxampp 
Php 错误：无法创建文件缓存目录
php 
使用OCI_num_行在OCI/PHP中发布
php 
Php mysql中的日期格式，如何进行转换查询？
phpmysql 
Php 按1使用SQL输出
phpmysql 
语法错误，意外'；定义'；（T_字符串）位于第1行的/home/cloudcomadmin/public_html/wp-config.php中
phpwordpress 
php curl请求不返回任何内容
phpcodeignitercurl 
Php 对未定义函数的XAMPP调用
phpwordpressxampp


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
更改R中ggplot geom_多边形的颜色方案
									R
							 									Map
							 
R行表示按组（或唯一ID）在多个列上
									R
							 
我应该使用哪种布局来获取igraph中的非重叠边？
									R
							 									Plot
							 
理解r中的dlm包
									R
							 
R 如何在同一图形上绘制多条曲线段？
seg1
									R
							 									Plot
							 
R 基于另一列修改data.table的列并添加新列
									R
							 
R 自动转义unicode字符
									R
							 
正在抑制knitr/Rmarkdown中来自热图.2的错误消息
									R
							 
使用R通过SSL连接到红移
									R
							 									Amazon Redshift
							 
R使用roxygen2渲染Rd而不使用roxygen2版本
									R
							 
R 在引号之间以整数形式导入csv列
									R
							 									Csv
							 									Import
							 
什么'；这个for/if循环有什么问题？（R）
									R
							 									For Loop
							 
R 'class'的意外行为<-`()
									R
							 
在R中的内存中untar gzcon
									R
							 
R中图的平面性检验
									R
							 
使用ggplot2在R中绘制ROC曲线
									R
							 									Plot
							 
在一个函数中有多个pander（）
									R
							 
在R中按组滚动var1或var2的计数
									R
							 
具有多个可能的前缀和后缀的文件匹配模式R
									R
							 									Regex
							 
R 对行中的唯一字符串模式进行计数
									R
							 
用lambda函数在R中变异_？
									R
							 									Dataframe
							 
R 如果矩阵元素超过指定值，则将其加粗
									R
							 									Matrix
							 									Graphics
							 
macOS Catalina中的R/RStudio无法使用git
									R
							 									Git
							 									Macos
							 
R 闪亮：如何避免全局变量和每次观察一个问题
									R
							 									Shiny
							 
R中的子集似乎不起作用：将特定值作为子集的行的值
									R
							 
为什么我会收到这个错误：`data`和`reference`应该是具有相同级别的因子
									R
							 									Machine Learning
							 
R 无法在ubuntu上安装V8软件包？
									R
							 
R：使用分组将数据帧写入文本
									R
							 
如何在R中为闪亮的应用程序提供可变文件输入？
									R
							 									If Statement
							 									Shiny
							 
并行处理-R中的FOREACH和for loop
									R
							 									For Loop
							 									Parallel Processing
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Log4net
Opencart
Twitter Bootstrap
Karate
Ms Access
Iis
Cluster Computing
Phpstorm
Computer Vision
Scripting
Uitableview
Events
Object
Windows 7
Linker
Sencha Touch
Jasmine
Cloud Foundry
Wxpython
Vuejs2
Aem
Codenameone
Ubuntu
Protractor
C# 3.0
Sql Server 2008 R2
Fullcalendar
Glsl
Postgresql
Language Agnostic
Doctrine Orm
Scala
Intellij Idea
Caching
Magento2
Compilation
Ibm Mobilefirst
.net 4.0
Xamarin.ios
Nginx
Graph
Windows 10
Couchdb
Ajax
Spring Security
Debian
Wordpress
Xpath
Matplotlib
Dictionary
Next.js
Loops
Google Apps Script
Visual Studio 2012
Cron
Install4j
Sms
Ruby
Lambda
Image Processing
Ada
Rx Java
Azure
Z3
Amazon Web Services
Google Compute Engine
Ssh
Meteor
C++
Notepad++
Spring Batch
Zsh
Autodesk Forge
Ethereum
Openlayers
Xcode
Teradata
Primefaces
Ssrs 2008
Mysql
Websocket
Elm
Symfony
Xquery
Log4j
Big O
Ldap
Pine Script
Parameters
Download
Tridion
Hyperledger Fabric
Glassfish
Post
Amazon Ec2
Google Chrome
Appium
Responsive Design
Function
Android
Flash
Graphviz
Join
Transactions
Stream
Yaml
Docker
Sql Server 2005
Asp.net Mvc 4
Reflection
C++11
Asp.net Core
Speech Recognition
Nest
Vba
Twilio
Discord.py
Xslt
Mongodb
Flask
Azure Data Factory
Mod Rewrite
Sed
Oracle
Ansible
Playframework 2.0
Url Rewriting
Enums
Angular Material
Vb.net
Google App Engine
Stored Procedures
Visual Studio
Floating Point
Android Layout
Machine Learning
Stanford Nlp
Julia
Mariadb
Netsuite
Entity Framework 4
Windbg
Json
Npm
D
Gnuplot
Applescript
Clearcase
Windows Installer
Webstorm
Collections
Swagger
Aurelia
Azure Ad B2c
Windows Phone
Postman
Gmail
Windows Store Apps
Nativescript
Mqtt
Testing
Vbscript
Build
Rust
Internationalization
Swift2
Amazon Cloudformation
Sql Server 2008
Macros
Jetty
Office Js
Modelica
Gruntjs
Couchbase
Azure Functions
Silverlight 4.0
Formatting
Certificate
Go
Django Rest Framework
Netty
Html5 Canvas
Highcharts
Unicode
Graphics
Apache Flex
Redux
Hbase
Workflow
Mvvm
If Statement
Orm
Usb
Cygwin
Cors
Less
Bootstrap 4
Date
Google Calendar Api
Ms Office
Actions On Google


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网