R 根据级别长度为类别变量中的级别选择相同数量的行_R_Dataframe_Subset - Fatal编程技术网

R 根据级别长度为类别变量中的级别选择相同数量的行

r dataframe

R 根据级别长度为类别变量中的级别选择相同数量的行,r,dataframe,subset,R,Dataframe,Subset,我有一个“主数据帧”，对一个分类变量有不同的观察，我想创建，比如说，20个其他平衡的子数据帧对于这些新的子数据集，我希望保留变量x=0的所有行，并随机采样x=1的行，其中x=1的长度必须与x=0的长度相同所以，如果我们有这样的东西： x <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0) y <- sample(1:25) df <- data.frame(x,y) # master dataframe x这

我有一个“主数据帧”，对一个分类变量有不同的观察，我想创建，比如说，20个其他平衡的子数据帧

对于这些新的子数据集，我希望保留变量x=0的所有行，并随机采样x=1的行，其中x=1的长度必须与x=0的长度相同

所以，如果我们有这样的东西：

x <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0) 
y <- sample(1:25) 
df <- data.frame(x,y) # master dataframe

x这将为您提供一个包含25个元素的列表，每个元素都是从原始元素中随机抽样的18个观察值（每个x值的9个）的数据帧
库（dplyr）
l%样品（尺寸=l）
})
这将为您提供一个包含25个元素的列表，每个元素都是从原始元素中随机抽样的18个观察值（每个x值的9个）的数据帧
库（dplyr）
l%样品（尺寸=l）
})
考虑按一个或多个因子对数据帧进行子集并对每个子集应用函数的方法
df_list <- by(df, df$x, function(sub)
   sub[sample(1:nrow(sub), length(which(df$x=='0'))),]
)

df_new <- do.call(rbind, df_list)

df_list考虑按一个或多个因子对数据帧进行子集并对每个子集应用函数的by

df_list <- by(df, df$x, function(sub)
   sub[sample(1:nrow(sub), length(which(df$x=='0'))),]
)

df_new <- do.call(rbind, df_list)

df\u列表group\u by
？它不是base R的一部分。您是否在返回列表的lappy
中创建了一个列表？似乎是这样的groupby
从哪里派生？它不是base R的一部分。您是否在lappy
中创建了一个返回列表的列表？看起来是这样的




[dataframe]相关文章推荐



                                                        
Dataframe 循环内的DASK数据帧
dataframedask 
Dataframe Pyspark货币转换器
dataframepyspark 
Dataframe 条件下分区中的Pypark枚举
dataframepyspark 
Dataframe 使用Julia中的列表对数据帧进行子集设置
dataframejulia 
如何从Pyspark dataframe列中选择一些行并将其添加到新的dataframe？
dataframepyspark 
Dataframe 如何在将spark数据框中的数字数据写入csv时仅删除双引号
dataframeapache-spark 
Dataframe 在spark数据帧中生成哈希键（数据帧中的唯一标识符列）
dataframehashpyspark 
Dataframe 无法写入没有标头的Dynamicframe
dataframepyspark 
Dataframe 将URI查询字符串转换为PySpark中的结构键值数组
dataframeapache-sparkpyspark 
Dataframe 如何将pySpark中数据帧的所有列与其他单列相乘
dataframepyspark 
Dataframe Pyspark架构更新/更改数据帧
dataframepyspark 
Dataframe 如何在连接多个表后处理空值
dataframeapache-sparkpyspark 
Dataframe Query.jl-创建一个新列并立即使用它
dataframejulia 
Dataframe 如何将整数与数据帧相乘，并将结果放入新的数据帧
dataframe 
Dataframe 如何将列表添加为新列？
dataframeapache-sparkpyspark 
Dataframe 获取错误：FUN中的错误（X[[i]]，…）：仅在包含所有数值变量的数据帧上定义；而sapply（x，is.numeric）返回所有TRUE？
dataframe 
                                       





随机文章推荐



                                                        
Proxy 规模、性能代理（加载外部内容）？
proxy 
Proxy 如何将Lighttpd设置为跨站点请求的代理？
proxy 
Proxy 是什么导致POCO代理实体有时只能在实体框架4中创建
proxyentity-framework-4 
Proxy PAC文件中的HTTPS
proxy 
Proxy 可以在winhttp对象中封装Xml Rpc调用吗？
proxy 
Proxy “什么是？”；错误参数#-1到'；新线'；（预期代理，为零）平均值
proxylua 
Proxy Openshift代理超时
proxyopenshift 
Proxy Docker redsocks代理位于HTTP代理之后，没有internet DNS
网络环境

没有可用的internet DNS
允许在端口3128上进行HTTP和HTTPS通信的公司squid代理

Docker环境
proxydocker 
Proxy tcp代理会话详细信息包括什么？
proxy 
Proxy 通过WSO2 ESB代理在多个系统中搜索用户
proxywso2 
Proxy Internet Explorer浏览器的代理设置中的优先级机制是什么
proxy 
Proxy 如何在电报socks代理中使用IPv6地址？
proxytelegram 
Proxy 创建react应用程序：使用代理进行Jest测试
proxyjestjs 
Proxy db2用作代理的数据流
proxydb2


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R在数据框中组合2列
									R
							 
R 使用ggplot2为分组数据生成箱线图
									R
							 
R data.table加速SI/公制转换
									R
							 									Performance
							 
如何使submit按钮仅从Shiny（R）中的相应文本输入中获取值
									R
							 									Shiny
							 
R 如何将列表转换为数据帧，但删除内部列表结构？
									R
							 									List
							 									Dataframe
							 
R stats包中nlm函数的源代码
									R
							 
使用Brew、Pander和R自动化LaTeX报告
									R
							 									Latex
							 
在命令行工具curl中使用R complete-X POST
									R
							 									Curl
							 
R 使用函数更改数据帧值
									R
							 									Function
							 									Dataframe
							 
R 如何在需要分组的数据集上计算聚合？
									R
							 
R在ggplot2的x轴上绘制年龄（以年和月为单位）
									R
							 
r从向量中提取最后和第一个非NA元素
									R
							 									Matrix
							 									Vector
							 
R 从大型数据集中生成重复数据子集
									R
							 
R 如何解决问题？
									R
							 
R 如何连接网络图中的两个节点并打印路径？
									R
							 
用R中的子样本进行预测
									R
							 
R中选定点和剩余点之间的最小距离？
									R
							 									For Loop
							 
无法在rstudio Windows10中更新程序包
									R
							 
C5.0 R中的机器学习，测试数据的准确率为100%
									R
							 									Machine Learning
							 
使用ViSEAGO create_topGO加载自己的数据时出错
									R
							 
带apply循环的R中的列选择错误
									R
							 
R、 ggplot2：添加特定的勾号+；在不更改其他网格线的情况下将标签添加到轴
									R
							 
R 是否有任何选项设置bsts预测的上限？
									R
							 
R tmap/tmaptools地理代码_OSM功能错误
									R
							 
R 如何将包含正则表达式的代码包装到函数中
									R
							 									Function
							 
R 运行t测试时如何修复错误
									R
							 
R 使用光栅化函数的问题
									R
							 									Function
							 
将值作为因子的光栅图层转换为SpatialPixelsDataFrame
									R
							 
读入单个xlsx文件，执行条件格式设置，并在R中导出为多个xlsx文件
									R
							 									Loops
							 									Formatting
							 
有没有办法在R studio中下载excel文件
									R
							 									Json
							 									Excel
							 									Api
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Here Api
Xslt
Cloud Foundry
Blackberry
Raspberry Pi
Verilog
Sms
Excel Formula
Parse Platform
Iis
Entity Framework 4
Couchdb
Google Cloud Firestore
Automated Tests
Install4j
Browser
Sencha Touch
Cors
Msbuild
Socket.io
Docker Compose
Centos
Ruby On Rails 3.1
Cypress
Telerik
Memory Management
Hbase
Apache2
Ssl
Linkedin
Heroku
Dynamics Crm 2011
Vim
Google App Engine
Python Sphinx
Mapbox
Compression
Google Bigquery
Pascal
Shopify
Twitter Bootstrap
Colors
Apache Storm
Single Sign On
Http
3d
Meteor
Xsd
Sublimetext2
Pentaho
Google Plus
Sql Server 2008 R2
Build
Virtual Machine
Grid
Xmpp
Sml
Apache Flink
Encoding
Snmp
Antlr4
Terminal
Joomla
Autocomplete
Ionic2
Layout
Silverlight 4.0
Synchronization
Dataframe
Asp.net Web Api
Sugarcrm
Sharepoint
Azure Service Fabric
Jasper Reports
Plsql
Function
Vuejs2
Sapui5
R
Lucene
Responsive Design
Interface
Neural Network
Asp.net
Spotify
Google Visualization
Angularjs
Domain Driven Design
C#
Editor
Xamarin.android
Bootstrap 4
Excel
Youtube
Jqgrid
Jmeter
Charts
Abap
Visual Studio Code
Mdx
Jwt
Sharepoint 2010
Hazelcast
Sql Server
Listview
Crystal Reports
Asterisk
Visual Studio 2010
Antlr
Javascript
Jhipster
Functional Programming
Wix
Mvvm
Modelica
Java Me
Xamarin.forms
Python 3.x
Jdbc
Mono
Jaxb
Windows
Download
Jquery Plugins
Servlets
Bison
Gwt
Content Management System
Post
Clang
Oracle10g
Asp.net Mvc 2
Machine Learning
Cucumber
Inheritance
Microsoft Graph Api
Architecture
Wicket
Playframework 2.0
Elm
Windows 7
Ag Grid
Winforms
Computer Science
Error Handling
Amazon Redshift
Orchardcms
Android Ndk
Dependency Injection
Language Agnostic
Sip
Notifications
Select
Imagemagick
Shiny
Xampp
Discord
Discord.py
Oracle11g
Google Sheets
Anaconda
Embedded
Oauth
Mapreduce
Numpy
Parallel Processing
Ubuntu
Windows Phone 7
Swiftui
Asp.net Mvc 3
Yii2
Vmware
Tomcat
Qt4
Azure Ad B2c
Signalr
Laravel
Llvm
Merge
Asynchronous
Qml
Zend Framework
Jersey
Jquery Mobile
Aws Lambda
Wordpress
Windows Installer
Jquery
Geolocation
Frameworks
Oauth 2.0
Sprite Kit
Grafana
Batch File
Filesystems
Docker
Ssrs 2008
Visual Studio 2008
Model View Controller
Oracle Apex
Hybris


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网