R 删除数据帧中不常用的行_R_Dataframe_Frequency - Fatal编程技术网

R 删除数据帧中不常用的行

r dataframe

R 删除数据帧中不常用的行,r,dataframe,frequency,R,Dataframe,Frequency,假设我有一个非常简单的数据框： a <- rep(5,30) b <- rep(4,80) d <- rep(7,55) df <- data.frame(Column = c(a,b,d)) a我们创建一个频率表，然后根据“列”中值的“计数”创建子集 tbl <- table(df$Column) >=60 subset(df, Column %in% names(tbl)[tbl]) 或者我们使用data.table library(data.ta

假设我有一个非常简单的数据框：

a <- rep(5,30)
b <- rep(4,80)
d <- rep(7,55)

df <- data.frame(Column = c(a,b,d))

a我们创建一个频率表
，然后根据“列”中值的“计数”创建子集

tbl <- table(df$Column) >=60
subset(df, Column %in% names(tbl)[tbl])

或者我们使用

data.table

library(data.table)
setDT(df)[, .SD[.N >= 60], Column]

library(data.table)
setDT(df)

df[Column %in% df[, .N, by = Column][N >= 60, Column]]

或者另一个带有

数据的选项。表是.I

setDT(df)[df[, .I[.N >=60], Column]$V1]

使用dplyr
的解决方案
library(dplyr)

df2 <- df %>%
  group_by(Column) %>%
  filter(n() >= 60)

库（dplyr）
df2%
分组依据（列）%>%
过滤器（n（）>=60）

或者是来自BaseR的解决方案
uniqueID <- unique(df$Column)
targetID <- sapply(split(df, df$Column), function(x) nrow(x) >= 60)

df2 <- df[df$Column %in% uniqueID[targetID], , drop = FALSE]

uniqueID使用data.table

library(data.table)
setDT(df)[, .SD[.N >= 60], Column]

library(data.table)
setDT(df)

df[Column %in% df[, .N, by = Column][N >= 60, Column]]

还有一个变量要回答，它使用联接而不是%
%中的%：
library(data.table)
setDT(df)
df[df[, .N, by = Column][N >= 60, .(Column)], on = "Column"]

有什么理由让这些数据保持为单独的行，而不是按每个值折叠成一行（带有“count”列）？这一点很好，但事实上，我需要以这种方式聚合数据




[dataframe]相关文章推荐



                                                        
Dataframe 基于字符串长度的Julia数据帧过滤
dataframejulia 
Dataframe 如果其他两列不符合筛选条件，则从列中获取值
dataframe 
Dataframe Deedle F#-查找索引组中的最大行数
dataframef# 
Dataframe 如何向Spark数据框添加一列，其中包含mean和count等聚合？
dataframepyspark 
Dataframe 如何使用geom_线连接多个连续缺失的数据值？
dataframe 
Dataframe 如何使用多列值聚合数据帧中的多列
dataframer 
Dataframe R中组内所有行之间的数值差
dataframer 
Dataframe 将HDF5作为Dask数据帧读取时出错，原因是什么？
dataframedask 
Dataframe Spark数据帧筛选器vs配置单元where子句
dataframeapache-sparkhive 
Dataframe 指定x轴尺寸julia statsplots包
dataframejulia 
Dataframe 基于条件对同一列中的值求和
dataframe 
Dataframe 拼花文件加载到内存的内部过程
dataframememory 
                                       





随机文章推荐



                                                        
Amp html 页面如何告知浏览器存在AMP HTML版本？
amp-html 
Amp html 示例中的查看器是搜索演示中旋转木马的变体吗？
amp-html 
Amp html 是否可以将www.yourdomain.com之类的域添加到AMP Iframe中？
amp-html 
Amp html AMP站点中remote.html的具体用途是什么？
amp-html 
Amp html AMP脚本标记可以放在单个文件中吗？
amp-html 
Amp html HTML属性的值无效'；数据videoid'；在标签'；amp；youtube'；
amp-html 
Amp html 使用amp列表在AMP4HTML中创建动态amp转盘
amp-html 
Amp html Can'；选择结果时是否从amp自动完成链接？
amp-html 
Amp html 什么；“互动组件”；可以在amp故事中使用吗？
amp-html 
Amp html AMP阻塞主线程
amp-html 
Amp html amp脚本：innerHTML按原样呈现符号和转义序列
amp-html 
Amp html 制作高度响应放大器列表
amp-html


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R 使用。。。内联参数
									R
							 
R 随机林错误-我的内存不足吗？
									R
							 
尝试应用外部函数时，R:中出现错误：
									R
							 
R：如何在使用gwidgets时暂停脚本并存储use输入值？
									R
							 
匹配R中两个独立数据集的时间和数据值
									R
							 									Time
							 
如何为R公式编制索引？
									R
							 
求R中共享序列的长度
									R
							 
减少R长度中的行序列
									R
							 
无法将HDF5打开到R
									R
							 
R can'；t加载ggplot2
									R
							 
道具台在for循环中不工作？
									R
							 									For Loop
							 
在R中使用apply（或其他迭代函数）创建向量矩阵
									R
							 									Matrix
							 									Encoding
							 
在R中绘制地图-仅显示外部边界
									R
							 									Maps
							 
使用双引号从R中的json字符串中提取文本
									R
							 									Regex
							 
R ggplot2：在aes映射中使用公式
									R
							 
为什么我得到“错误代码：400原因：无效值”在R中的GA报告核心API上创建序列？
									R
							 									Google Analytics
							 
从雅虎获取数据！向R提供资金
									R
							 
R：计算每个数据帧行的矩阵行列式
									R
							 
在R中的函数中存储列号
									R
							 
以dplyr管道内的特定列为目标
									R
							 
文件未在R脚本中的正确位置创建
									R
							 
在R中将字符变量更改为日期变量
									R
							 									Date
							 
R 在'；utils'；，细节
									R
							 									Linux
							 
auto.arima用于每日数据预测的日期太长
									R
							 
R （插入符号）包中机器学习模型的特征重要性
									R
							 									Variables
							 
如何选择r中具有特定值的行？
									R
							 									Sorting
							 
将iframe Amazon Associate链接嵌入到.md文件R中
									R
							 
R 一个图中的多元线性回归（ggplot2）
									R
							 									Plot
							 
如何根据日期和时间将轨迹（ltraj类）分割为突发？
									R
							 
R：如何使用Pivot\u合并行
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Alfresco
Logging
Soap
Cmake
Go
Aws Lambda
Ip
Search
Haskell
Signalr
Webpack
Web Scraping
Fullcalendar
C++
Android Studio
Sql Server 2008 R2
Sugarcrm
Xamarin
Entity Framework 4
Octave
Compression
Mediawiki
Three.js
Material Ui
Perforce
Github
Resharper
Neural Network
Cakephp
Composer Php
Blackberry
D
Apache Kafka
Libgdx
Checkbox
Google App Maker
Codeigniter
Vagrant
Active Directory
Process
If Statement
Tinymce
Path
Visual Studio
Ide
Project Management
Doctrine Orm
Nosql
Electron
C
Wordpress
Vaadin
Asp.net Mvc 5
Itext
Windows Store Apps
Telegram
Sharepoint
Responsive Design
Virtualbox
Netlogo
Jwt
Wix
Graphql
C# 4.0
Ember.js
Laravel
Python 3.x
Udp
Firefox Addon
Mono
Cron
Antlr4
Erlang
File Upload
Netbeans
Sapui5
Ios8
E Commerce
Charts
Ios6
Optimization
Ftp
Pentaho
Amazon Web Services
Cryptography
Atom Editor
Lucene
Batch File
Graphics
Spring Security
Database
Lisp
Mariadb
Twitter Bootstrap
Web
Glsl
Google Maps Api 3
Windbg
Mongodb
Ssas
Vmware
Sphinx
Teamcity
Linkedin
Terminal
Pagination
Snmp
Mdx
Curl
Tridion
Unit Testing
Rest
Dynamics Crm 2011
Cmd
Kendo Ui
Blazor
Cocoa
Mercurial
Google Cloud Platform
Struts2
Memory Management
Bluetooth
Ruby On Rails 3.2
Coldfusion
Django Models
Coding Style
Tomcat
Lambda
Math
Com
Content Management System
Cassandra
Grid
Drools
Windows Runtime
Mapreduce
Anaconda
Zsh
Autodesk Forge
Monitoring
Asp.net Mvc 4
Xna
Passwords
Sorting
Security
Docker Compose
Network Programming
Reporting Services
Combobox
Tsql
Windows Phone 7
Jsf 2
Scala
Angularjs
Gulp
Embedded
Windows Installer
Winapi
Scrapy
3d
Woocommerce
Layout
Spring Batch
Solr
Yocto
Install4j
Plsql
Routes
Programming Languages
Pine Script
Visual Studio Code
Json
For Loop
Cloud
Sed
Input
Matplotlib
Cocos2d Iphone
Html
Junit
Data Structures
Windows Phone 8.1
Next.js
Requirejs
Spring Integration
Activemq
Bison
Ms Office
Rdf
Jsp
Exchange Server
Oracle
Meteor
Bootstrap 4
Tfs
Sencha Touch 2
Tensorflow
Log4net
Cucumber
Wxpython
Nestjs


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网