R 在一个数据帧中仅保留与ID对应的两行_R_Subset - Fatal编程技术网

R 在一个数据帧中仅保留与ID对应的两行

r

R 在一个数据帧中仅保留与ID对应的两行,r,subset,R,Subset,我有以下数据（这是一个模拟版本），我正在使用R ID m 1 m1 1 m2 1 m3 2 m1 2 m2 3 m1 3 m2 3 m3 3 m4 4 m1 每个ID都有一个m1行，其余m的长度在ID中是可变的。我想保留m1值和每个ID对应的最后一个值。理想的输出如下所示： ID m 1 m1 1 m3 2 m1 2 m2 3 m1 3 m4 4 m1 事先非常感谢一个选项是使用data.table 将“data.frame”转换为“data.table”

我有以下数据（这是一个模拟版本），我正在使用R

ID m
1  m1
1  m2
1  m3
2  m1
2  m2
3  m1
3  m2
3  m3
3  m4
4  m1

每个ID都有一个m1行，其余m的长度在ID中是可变的。我想保留m1值和每个ID对应的最后一个值。理想的输出如下所示：

ID m
1  m1
1  m3
2  m1
2  m2
3  m1
3  m4
4  m1

事先非常感谢

一个选项是使用

data.table

将“data.frame”转换为“data.table”（

setDT（df1）

）。按“ID”列分组，并根据逻辑条件对数据集进行子集。如果行数为1（

If（.N==1）

），我们取“m”的值，即每个组的唯一值或

其他

，我们将每个组的值与“m1”（

m[m==m1']

）以及最后一个值“m”（

m[.N]

）连接在一起

library(data.table)
setDT(df1)[, list(m=if(.N==1) m else c(m[m=='m1'], m[.N])), by = ID]
#   ID  m
#1:  1 m1
#2:  1 m3
#3:  2 m1
#4:  2 m2
#5:  3 m1
#6:  3 m4
#7:  4 m1

一个选项是使用

data.table

将“data.frame”转换为“data.table”（

setDT（df1）

）。按“ID”列分组，并根据逻辑条件对数据集进行子集。如果行数为1（

If（.N==1）

），我们取“m”的值，即每个组的唯一值或

其他

，我们将每个组的值与“m1”（

m[m==m1']

）以及最后一个值“m”（

m[.N]

）连接在一起

library(data.table)
setDT(df1)[, list(m=if(.N==1) m else c(m[m=='m1'], m[.N])), by = ID]
#   ID  m
#1:  1 m1
#2:  1 m3
#3:  2 m1
#4:  2 m2
#5:  3 m1
#6:  3 m4
#7:  4 m1

与dplyr的结果相同：

df %>% 
   group_by(ID) %>%
   filter(row_number()==n()|m=='m1')


Source: local data frame [7 x 2]
Groups: ID

  ID  m
1  1 m1
2  1 m3
3  2 m1
4  2 m2
5  3 m1
6  3 m4
7  4 m1

与dplyr的结果相同：

df %>% 
   group_by(ID) %>%
   filter(row_number()==n()|m=='m1')


Source: local data frame [7 x 2]
Groups: ID

  ID  m
1  1 m1
2  1 m3
3  2 m1
4  2 m2
5  3 m1
6  3 m4
7  4 m1

A

base

R解决方案：

df[ave(logical(nrow(df)),df$ID,FUN=function(x) seq_along(x) %in% c(1,length(x))),]
#   ID  m
#1   1 m1
#3   1 m3
#4   2 m1
#5   2 m2
#6   3 m1
#9   3 m4
#10  4 m1

A

base

R解决方案：

df[ave(logical(nrow(df)),df$ID,FUN=function(x) seq_along(x) %in% c(1,length(x))),]
#   ID  m
#1   1 m1
#3   1 m3
#4   2 m1
#5   2 m2
#6   3 m1
#9   3 m4
#10  4 m1

另一种

base R

方式是使用拆分、应用、组合样式过滤器：

`rownames<-`(do.call(rbind, lapply(split(df,df$ID), function(x) {
  x[x$m=="m1"|seq(nrow(x))==nrow(x),]})),NULL)
#   ID  m
# 1  1 m1
# 2  1 m3
# 3  2 m1
# 4  2 m2
# 5  3 m1
# 6  3 m4
# 7  4 m1

`rownames另一种基本R
方式是使用拆分、应用、组合样式过滤器：
`rownames<-`(do.call(rbind, lapply(split(df,df$ID), function(x) {
  x[x$m=="m1"|seq(nrow(x))==nrow(x),]})),NULL)
#   ID  m
# 1  1 m1
# 2  1 m3
# 3  2 m1
# 4  2 m2
# 5  3 m1
# 6  3 m4
# 7  4 m1

`rownames一堆基本的R单行程序：
x[c(diff(x$ID),1) == 1 | c(1,diff(x$ID)) == 1, ]
x[(c(diff(x$ID),1) + c(1,diff(x$ID))) == 1, ]
x[x$m == 'm1' | c((x$m == 'm1')[-1],TRUE), ]
x[pmax(x$m == 'm1',c((x$m == 'm1')[-1],1)) == 1, ]

一组基本R一行：
x[c(diff(x$ID),1) == 1 | c(1,diff(x$ID)) == 1, ]
x[(c(diff(x$ID),1) + c(1,diff(x$ID))) == 1, ]
x[x$m == 'm1' | c((x$m == 'm1')[-1],TRUE), ]
x[pmax(x$m == 'm1',c((x$m == 'm1')[-1],1)) == 1, ]

好啊你的问题是什么？我希望你已经做了一些研究，至少对如何做到这一点有了一些想法。谢谢你的编辑，我只是在发帖后才意识到这个问题看起来很糟糕。至于我的问题，是的，我做了一些研究，但我只能够保持可以设置为特定字符串的值，我在ID中的最后一个值不同，我不知道如何保持这些值。谢谢。@akrun没问题。。事实上，我刚刚学习了行数
功能！好啊你的问题是什么？我希望你已经做了一些研究，至少对如何做到这一点有了一些想法。谢谢你的编辑，我只是在发帖后才意识到这个问题看起来很糟糕。至于我的问题，是的，我做了一些研究，但我只能够保持可以设置为特定字符串的值，我在ID中的最后一个值不同，我不知道如何保持这些值。谢谢。@akrun没问题。。事实上，我刚刚学习了行数
功能！很好，谢谢你。另外，我要特别感谢你没有对我最初对这个问题的糟糕编辑感到不满。@Pierrelaffortune你可以将其作为一个单独的答案发布。如果列没有排序，它不会给出不同的结果。i、 OP希望“m1”作为一个值。这是真的，我纠正了“m1”值错位的情况。这很有效，非常感谢。另外，我要特别感谢你没有对我最初对这个问题的糟糕编辑感到不满。@Pierrelaffortune你可以将其作为一个单独的答案发布。如果列没有排序，它不会给出不同的结果。i、 OP想要“m1”作为一个值。没错，我纠正了“m1”值放错位置的情况。@akrun我明白了。我试图解决这个问题。这也很有效，非常感谢。我会努力成为dplyr的专家，这看起来很直观而且非常有用。@Bogs修复Akrun是必要的。没有它，我仍在试图找出问题所在。我是一名非常新的R程序员，我从直觉上理解您对dplyr
的看法，但当我更加熟练时，我会尝试学习data.table
。@akrun我明白了。我试图解决这个问题。这也很有效，非常感谢。我会努力成为dplyr的专家，这看起来很直观而且非常有用。@Bogs修复Akrun是必要的。没有它，我仍在试图找出问题所在。我是一名非常新的R程序员，我从直觉上理解你对dplyr
的看法，但当我更熟练时，我会尝试学习数据表
。base R中的Meravigliose queste soluzioni。@SabDeM你知道我是意大利人吗，或者这只是巧合？：）这只是一个统计问题：我认为90%的你是意大利人，因为你叫“尼古拉”。@SabDeM你是对的！无论如何，非常感谢您的评论，非常感谢！R基地的Meravigliose queste soluzioni@SabDeM你知道我是意大利人吗，还是这只是巧合这只是一个统计问题：我认为90%的你是意大利人，因为你叫“尼古拉”。@SabDeM你是对的！无论如何，非常感谢您的评论，非常感谢！




[dependencies]相关文章推荐



                                                        
Dependencies prolog谓词依赖树
dependenciesprolog 
Dependencies 如何在setup.py中包含rpm依赖项
dependencies 
Dependencies RPM软件包可以使用RPM命令安装，但无法通过yum依赖项检查
dependencies 
Dependencies 如何生成没有依赖项的Crystal可执行文件？
dependencies 
                                       





随机文章推荐



                                                        
Autohotkey 自动热键-捕获额外的鼠标按钮
autohotkey 
Autohotkey 这个AHK脚本是如何工作的？
autohotkey 
Autohotkey 自动热键中键的双重使用？
autohotkey 
Autohotkey 创建鼠标热键
autohotkey 
Autohotkey 避免重复按同一快捷键而不改变原来的1按快捷键功能（自动热键）时出现循环
autohotkey 
Autohotkey 如何在AHK if InStr中使用非法字符
autohotkey 
Autohotkey a“的解决方案；“动态”/&引用；“不稳定”；阿库的班名？
autohotkey 
Autohotkey 发送自动热键脚本后，如何将光标放置在某个点上？
autohotkey 
Autohotkey 脚本赢得'；不要运行一段代码
autohotkey 
Autohotkey Alt+；Shift快捷方式在AHK中工作不可靠
autohotkey 
Autohotkey AHK设置窗口标题（如果包含）
autohotkey 
Autohotkey 自动热键-如何使用操纵杆发送控制K
autohotkey 
Autohotkey 在自动热键中创建多个步骤
autohotkey 
Autohotkey 在两个监视器之间移动鼠标
autohotkey 
Autohotkey 我想用自动热键，从午夜开始以毫秒为单位获取当前时间
autohotkey 
Autohotkey 如何使用autokey创建带有花括号的脚本
autohotkey 
Autohotkey 如果再次按下该键，则功能不同
autohotkey 
Autohotkey 需要有关像素更改时关闭AHK脚本的帮助吗
autohotkey 
Autohotkey 啊，如何通过列表更新GUI热键的值
autohotkey


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
如何将包含符号的绘图写入R中的PDF？
									R
							 									Pdf
							 									Encoding
							 
在R中交织两个数据帧
									R
							 									Merge
							 									Dataframe
							 
R 从带有多个面的ggplot2中的聚集条形图中删除空因子
									R
							 
R 指定knit2html的输出路径
									R
							 
如何改进Rcpp（RcppEigen）包的Makevars文件？
									R
							 									Makefile
							 
R 如何按个人对面板数据进行采样/分区（最好使用插入符号库）？
									R
							 
运行Rscript的输出与源之间的差异
									R
							 									Encoding
							 
在dplyr中查找滑动窗口上的方差
									R
							 
R 将不同的最高分数转换为100分的百分比
									R
							 
为什么这个函数找不到R中的最小值？
资料
									R
							 
R将多个列联表合并为一个列联表
									R
							 
Plotly R子批次按组生成错误（代码与示例相同）
									R
							 
R 聚合包含数字和字符串的列
									R
							 
制定NLOPTR和x27中的不等式约束；s-ISRES算法
									R
							 
R 返回特定字母后面的数字直到下一个字母的正则表达式
									R
							 									Regex
							 									String
							 
R ggplot箱线图错误：长度必须为1或与数据（100）相同：x，y
									R
							 									Error Handling
							 
R 按句子而不是按特殊模式拆分文本
									R
							 									Regex
							 
R中的集成
									R
							 
R 使用条件的数据表子集，并且仅来自该子集的特定行
									R
							 
R 无法为使用“创建”的打印名称启动png（）设备；粘贴"；功能
									R
							 									Plot
							 
从r中拟合的随机林计算精确召回率的库
									R
							 
r函数错误：对象'；y'；找不到
									R
							 									Function
							 
R 将两个XTS对象合并为一个逻辑对象
									R
							 
什么是SockJSAdapter？为什么它会无休止地运行
									R
							 									Shiny
							 
R 为什么我在尝试对它们进行分组时会得到一个额外的类别？
									R
							 
R rbind命令删除额外信息
									R
							 
R 基于非累积行和的数据帧子集
									R
							 
标题：将变量值传递给R中的函数
									R
							 
R 扩展xts对象并填充NA的最佳方法是什么？
									R
							 
R软件包安装时间过长-源代码或二进制类型
									R
							 									Installation
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Spring Integration
Sencha Touch
Joomla
Paypal
Tridion
Lua
Loops
Iis
Gps
Excel Formula
Coffeescript
Dll
Udp
Oracle10g
Firefox
Silverlight 4.0
Gatsby
Chef Infra
Hybris
Soap
If Statement
Arangodb
Sonarqube
Polymer
Syntax
Yocto
Umbraco
Awk
Service
Asp.net Mvc 5
Salesforce
Filesystems
Scikit Learn
Stream
Botframework
Mapping
Compiler Errors
Notepad++
Extjs4
Jira
Windows 7
Time Complexity
Windows 8
Snmp
Push Notification
Macos
Mongodb
Netsuite
Reporting Services
Emacs
Google Analytics
Antlr4
Nunit
Dom
Jvm
Amazon Ec2
Model View Controller
Pagination
Templates
Composer Php
Google Drive Api
Uitableview
Report
Airflow
Unit Testing
Json
Jetty
Replace
Hive
Drools
EmptyTag
Rdf
Elixir
Data Binding
Xmpp
Firefox Addon
Big O
Leaflet
Plone
Shiny
Aws Lambda
Mqtt
Download
Drupal
Sorting
Javascript
Ldap
Open Source
Usb
Yii2
.htaccess
Jmeter
Cypress
Sublimetext3
Cygwin
Express
Postgresql
Configuration
Markdown
Plot
Razor
Vb6
Linux
List
Webview
Asterisk
Sharepoint 2007
Vhdl
Assembly
Pascal
Mfc
Permissions
Tabs
Proxy
Sap
Sequelize.js
Keras
Safari
Phpstorm
Xquery
Docusignapi
Windows Runtime
Spring
Recursion
Dynamic
Wolfram Mathematica
Grep
Here Api
Web Scraping
Azure Cosmosdb
Reflection
Dialogflow Es
Cakephp
Command Line
Jsf
Coding Style
Appium
Kotlin
Drop Down Menu
Deployment
Kernel
Mod Rewrite
Cobol
View
Path
Mediawiki
Pentaho
Ios7
Binding
Xsd
Unity3d
Discord.py
Breeze
Ckeditor
Ibm Midrange
Ios
Influxdb
Ip
Tfs
Prestashop
Properties
Scheme
Wordpress
Ant
Sockets
Windows Installer
Swift2
Google Bigquery
Android Ndk
Windbg
Amazon Redshift
Stm32
Youtube
Sql Server 2008
Knockout.js
Ag Grid
Dependencies
Compression
Perforce
Kibana
Google Visualization
Dojo
Menu
Vim
Phantomjs
Version Control
Netty
Timer
Orm
Apache Spark
Curl
Wix
Jquery Plugins
Autodesk Forge
Scala
Linux Kernel
Opencl
Air
.net 4.0
Ssis
Gnuplot


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网