筛选R中的多个日期列_R_Data.table - Fatal编程技术网

筛选R中的多个日期列

r

筛选R中的多个日期列,r,data.table,R,Data.table,我有一个3列的数据框。（）前两列（“Time1”、“Time2”）包含日期时间数据，并且都具有posixct格式：%Y-%m-%d%H:%m:%S” 因此，我最终需要的是行的子选择，其中对于Time1中的特定时间，只有行在Time2中被选择是时间1的前一天（这里一天并不总是24小时；一天是指前一个日历日，基本上是“昨天”）和时间2是凌晨12:00 一个正确的例子： +---------------------+----------------------+ | Time1

我有一个3列的数据框。（）

前两列（“Time1”、“Time2”）包含日期时间数据，并且都具有posixct格式：

%Y-%m-%d%H:%m:%S”

因此，我最终需要的是行的子选择，其中对于Time1中的特定时间，只有行在Time2中被选择

是时间1的前一天（这里一天并不总是24小时；一天是指前一个日历日，基本上是“昨天”）
和时间2是凌晨12:00

一个正确的例子：

+---------------------+----------------------+
|        Time1        |        Time2         |
+---------------------+----------------------+
| 2016-11-01 00:00:00 | 2016-10-31 00:00:00  |
+---------------------+----------------------+

一个错误的例子：

+---------------------+----------------------+
|        Time1        |        Time2         |
+---------------------+----------------------+
| 2016-11-01 00:00:00 | 2016-10-31 12:00:00  |
+---------------------+----------------------+

在上传的文件中，我手动添加了第三列（“值”），作为我希望在最后过滤的行的指导。带“True”的行对我来说很有趣

我用两个for循环解决了这个问题，但是在大型表中运行速度非常慢

使用

子集

和

润滑油

包的解决方案可以使用以下方法：

将1天添加到

Time2

，然后选中

Time1

&

Time2

属于同一天

在

HHMMSS

格式中格式化

Time2

，然后检查其是否小于

（中午）

守则：

library(lubridate)

subset(df, format(Time1,"%Y%m%d") == format(Time2+days(1),"%Y%m%d") &
        as.integer(format(Time2, "%H%M%S")) < 120000 )

#                    Time1      Time2 Value
# 19   2016-11-01 00:00:00 2016-10-31  TRUE
# 39   2016-11-01 00:30:00 2016-10-31  TRUE
# 59   2016-11-01 01:00:00 2016-10-31  TRUE
# 79   2016-11-01 01:30:00 2016-10-31  TRUE
# 99   2016-11-01 02:00:00 2016-10-31  TRUE
# 119  2016-11-01 02:30:00 2016-10-31  TRUE
# 139  2016-11-01 03:00:00 2016-10-31  TRUE
# 159  2016-11-01 03:30:00 2016-10-31  TRUE
# 179  2016-11-01 04:00:00 2016-10-31  TRUE
# 
# so on

使用

子集

和

润滑油

包的解决方案可以使用以下方法：

将1天添加到

Time2

，然后选中

Time1

&

Time2

属于同一天

在

HHMMSS

格式中格式化

Time2

，然后检查其是否小于

（中午）

守则：

library(lubridate)

subset(df, format(Time1,"%Y%m%d") == format(Time2+days(1),"%Y%m%d") &
        as.integer(format(Time2, "%H%M%S")) < 120000 )

#                    Time1      Time2 Value
# 19   2016-11-01 00:00:00 2016-10-31  TRUE
# 39   2016-11-01 00:30:00 2016-10-31  TRUE
# 59   2016-11-01 01:00:00 2016-10-31  TRUE
# 79   2016-11-01 01:30:00 2016-10-31  TRUE
# 99   2016-11-01 02:00:00 2016-10-31  TRUE
# 119  2016-11-01 02:30:00 2016-10-31  TRUE
# 139  2016-11-01 03:00:00 2016-10-31  TRUE
# 159  2016-11-01 03:30:00 2016-10-31  TRUE
# 179  2016-11-01 04:00:00 2016-10-31  TRUE
# 
# so on

以下解决方案有效。解决方案使用

OP

library(dplyr)
library(lubridate)

df %>%
  filter((as.Date(Time2)+days(1)) == as.Date(Time1) & format(Time2, "%H") < 12)


#                   Time1      Time2 Value
# 1   2016-11-01 00:00:00 2016-10-31  TRUE
# 2   2016-11-01 00:30:00 2016-10-31  TRUE
# 3   2016-11-01 01:00:00 2016-10-31  TRUE
# 4   2016-11-01 01:30:00 2016-10-31  TRUE
# 5   2016-11-01 02:00:00 2016-10-31  TRUE
# 6   2016-11-01 02:30:00 2016-10-31  TRUE
# 7   2016-11-01 03:00:00 2016-10-31  TRUE
# 8   2016-11-01 03:30:00 2016-10-31  TRUE
# 9   2016-11-01 04:00:00 2016-10-31  TRUE
# 10  2016-11-01 04:30:00 2016-10-31  TRUE
# so on

库（dplyr）
图书馆（lubridate）
df%>%
过滤器（（截止日期（Time2）+天数（1））==截止日期（Time1）和格式（Time2，“%H”）<12）
#时间1时间2值
#1 2016-11-01 00:00:00 2016-10-31真实
#2 2016-11-01 00:30:00 2016-10-31真实
#3 2016-11-01 01:00:00 2016-10-31真实
#4 2016-11-01 01:30:00 2016-10-31真实
#5 2016-11-01 02:00:00 2016-10-31真实
#6 2016-11-01 02:30:00 2016-10-31真实
#7 2016-11-01 03:00:00 2016-10-31真实
#8 2016-11-01 03:30:00 2016-10-31真实
#9 2016-11-01 04:00:00 2016-10-31真实
#10 2016-11-01 04:30:00 2016-10-31真实
#诸如此类

以下解决方案有效。解决方案使用

OP

library(dplyr)
library(lubridate)

df %>%
  filter((as.Date(Time2)+days(1)) == as.Date(Time1) & format(Time2, "%H") < 12)


#                   Time1      Time2 Value
# 1   2016-11-01 00:00:00 2016-10-31  TRUE
# 2   2016-11-01 00:30:00 2016-10-31  TRUE
# 3   2016-11-01 01:00:00 2016-10-31  TRUE
# 4   2016-11-01 01:30:00 2016-10-31  TRUE
# 5   2016-11-01 02:00:00 2016-10-31  TRUE
# 6   2016-11-01 02:30:00 2016-10-31  TRUE
# 7   2016-11-01 03:00:00 2016-10-31  TRUE
# 8   2016-11-01 03:30:00 2016-10-31  TRUE
# 9   2016-11-01 04:00:00 2016-10-31  TRUE
# 10  2016-11-01 04:30:00 2016-10-31  TRUE
# so on

库（dplyr）
图书馆（lubridate）
df%>%
过滤器（（截止日期（Time2）+天数（1））==截止日期（Time1）和格式（Time2，“%H”）<12）
#时间1时间2值
#1 2016-11-01 00:00:00 2016-10-31真实
#2 2016-11-01 00:30:00 2016-10-31真实
#3 2016-11-01 01:00:00 2016-10-31真实
#4 2016-11-01 01:30:00 2016-10-31真实
#5 2016-11-01 02:00:00 2016-10-31真实
#6 2016-11-01 02:30:00 2016-10-31真实
#7 2016-11-01 03:00:00 2016-10-31真实
#8 2016-11-01 03:30:00 2016-10-31真实
#9 2016-11-01 04:00:00 2016-10-31真实
#10 2016-11-01 04:30:00 2016-10-31真实
#诸如此类

问题已标记为

数据。表

。此外，OP提供的样本数据集属于

data.table类。因此，我觉得有义务发布一个数据表解决方案：
library(data.table)
DT[as.IDate(Time1) - 1L == as.IDate(Time2) & hour(Time2) < 12]

as.IDate（）
是一个具有整数存储的日期类，用于快速排序和分组。因此，我们可以使用整数算法来计算前一天的数据hour（）
也由data.table
包提供，并将一天中的小时数作为整数值返回
可再现数据
2018年5月29日22:00 UTC从复制的数据，但删除了.internal.selfref
指针：
DT <- structure(
  list(
    Time1 = structure(c(1477958400, 1477958400, 1477958400,
                        1477958400, 1477958400, 1477958400, 1477958400, 1477960200, 1477960200,
                        1477960200, 1477960200, 1477960200, 1477960200, 1477960200, 1477962000,
                        1477962000, 1477962000, 1477962000, 1477962000, 1477962000, 1477962000,
                        1477963800, 1477963800, 1477963800, 1477963800, 1477963800, 1477963800,
                        1477963800), 
                      class = c("POSIXct", "POSIXt"), tzone = "UTC"),
    Time2 = structure(c(1477699200, 1477742400, 1477785600, 1477828800,
                        1477872000, 1477915200, 1477958400, 1477699200, 1477742400,
                        1477785600, 1477828800, 1477872000, 1477915200, 1477958400,
                        1477699200, 1477742400, 1477785600, 1477828800, 1477872000,
                        1477915200, 1477958400, 1477699200, 1477742400, 1477785600,
                        1477828800, 1477872000, 1477915200, 1477958400), 
                      class = c("POSIXct", "POSIXt"), tzone = "UTC"), 
    Value = c("FALSE", "FALSE", "FALSE",
              "FALSE", "TRUE", "FALSE", "FALSE", "FALSE", "FALSE", "FALSE",
              "FALSE", "TRUE", "FALSE", "FALSE", "FALSE", "FALSE", "FALSE",
              "FALSE", "TRUE", "FALSE", "FALSE", "FALSE", "FALSE", "FALSE",
              "FALSE", "TRUE", "FALSE", "FALSE")), 
  .Names = c("Time1", "Time2", "Value"), 
  row.names = c(NA, -28L), 
  class = c("data.table", "data.frame"))

DT问题已标记为data.table
。此外，OP提供的样本数据集属于data.table类。因此，我觉得有义务发布一个数据表解决方案：
library(data.table)
DT[as.IDate(Time1) - 1L == as.IDate(Time2) & hour(Time2) < 12]

as.IDate（）
是一个具有整数存储的日期类，用于快速排序和分组。因此，我们可以使用整数算法来计算前一天的数据hour（）
也由data.table
包提供，并将一天中的小时数作为整数值返回
可再现数据
2018年5月29日22:00 UTC从复制的数据，但删除了.internal.selfref
指针：
DT <- structure(
  list(
    Time1 = structure(c(1477958400, 1477958400, 1477958400,
                        1477958400, 1477958400, 1477958400, 1477958400, 1477960200, 1477960200,
                        1477960200, 1477960200, 1477960200, 1477960200, 1477960200, 1477962000,
                        1477962000, 1477962000, 1477962000, 1477962000, 1477962000, 1477962000,
                        1477963800, 1477963800, 1477963800, 1477963800, 1477963800, 1477963800,
                        1477963800), 
                      class = c("POSIXct", "POSIXt"), tzone = "UTC"),
    Time2 = structure(c(1477699200, 1477742400, 1477785600, 1477828800,
                        1477872000, 1477915200, 1477958400, 1477699200, 1477742400,
                        1477785600, 1477828800, 1477872000, 1477915200, 1477958400,
                        1477699200, 1477742400, 1477785600, 1477828800, 1477872000,
                        1477915200, 1477958400, 1477699200, 1477742400, 1477785600,
                        1477828800, 1477872000, 1477915200, 1477958400), 
                      class = c("POSIXct", "POSIXt"), tzone = "UTC"), 
    Value = c("FALSE", "FALSE", "FALSE",
              "FALSE", "TRUE", "FALSE", "FALSE", "FALSE", "FALSE", "FALSE",
              "FALSE", "TRUE", "FALSE", "FALSE", "FALSE", "FALSE", "FALSE",
              "FALSE", "TRUE", "FALSE", "FALSE", "FALSE", "FALSE", "FALSE",
              "FALSE", "TRUE", "FALSE", "FALSE")), 
  .Names = c("Time1", "Time2", "Value"), 
  row.names = c(NA, -28L), 
  class = c("data.table", "data.frame"))

DT首先，pastebin的代码给出了一个错误“error:unexpected”%filter（time2-time1抱歉，我重新加载了该文件。它以前是一个data.table。现在我上传了一个data.frame。---我不知道如何表述（time2-time1@UDE_学生您的数据非常大。为什么不共享dput（head（df，20））
？这对每个人来说都会更容易。是的，你是对的，我用较短的版本更新了我的初始帖子：我使用lubridate
在base-R中添加了一个可能的解决方案。请看一看，首先，来自pastebin的代码给出了一个错误“error:unexpected%”过滤器（time2-time1抱歉，我重新上传了这个文件。它以前是一个data.table。现在我上传了一个data.frame。---我不知道如何表达（time2-time1@UDE_Student您的数据非常大。为什么不共享dput（head（df，20））
？这对每个人来说都会更容易。是的，你是对的，我用较短的版本更新了我的初始帖子：我使用lubridate在base-R中添加了一个可能的解决方案。看一看，两条小评论。1）您不需要在dplyr
链中使用$
。也许，您应该在OP
共享的数据上尝试您的解决方案，并检查它是否返回有效的输出。两个小注释。1）您不需要在dplyr
链中使用$
。也许，您应该在OP
共享的数据上尝试您的解决方案，并检查它是否返回有效的输出。很好地使用as.IDate
！实际上，OP
提供的数据在data.frame
中。我想提供一个base-R解决方案，以便t原始
结果中的行名称，让OP知道选择了哪些行




[jsf 2]相关文章推荐



                                                        
Jsf 2 何时使用<；用户界面：包括>；，标记文件、复合组件和/或自定义组件？
jsf-2 
Jsf 2 如何在JSF中定制HtmlCommandButton的onmouseover？
jsf-2 
Jsf 2 在DataTable组件中使用convertDateTime标记，每个ajax请求重新创建托管Bean
jsf-2 
Jsf 2 PrimeFaces布局需要在FireFox和IE上手动刷新
jsf-2primefaces 
Jsf 2 <；f:ajax>；包含具有compositecomponent的未知id
jsf-2 
Jsf 2 JSF 2.0@managedproperty无法从一个视图范围的bean运行到另一个视图范围的bean
jsf-2 
Jsf 2 icefaces ace datatable:筛选器框：如何对基于日期的表达式进行筛选
jsf-2 
Jsf 2 如何在Primefaces中动态添加文本框和日历？
jsf-2primefaces 
Jsf 2 警告：不支持的组件族/渲染器类型：org.omnifaces.component.script/javax.faces.Button
jsf-2 
Jsf 2 a4j:ajax event=“change”在第一次单击时不起作用，但在第二次单击时起作用
jsf-2 
Jsf 2 在JSF中的对话框中显示datatable中的行数据
jsf-2primefaces 
Jsf 2 无法使用Trinidad 2和Facelets加载ViewHandler（实例化异常）
jsf-2 
Jsf 2 JSF selectOneRadio，仅呈现某些项目
jsf-2 
Jsf 2 Glassfish连接池-java.sql.SQLException:连接已关闭
jsf-2jdbcoracle11g 
Jsf 2 f:viewAction不调用操作
jsf-2 
Jsf 2 访问我的JSF XHTML时未加载资源
jsf-2primefaces 
Jsf 2 PrimeFaces:文件上载视图未更新
jsf-2primefaces 
Jsf 2 检查是否注册了servlet筛选器
jsf-2 
Jsf 2 JSF默认页面（已解决：小心浏览器的301缓存）
jsf-2 
Jsf 2 @注入注释不适用显示错误？
jsf-2 
                                       





随机文章推荐



                                                        
Speech recognition I'；我将CMU Sphinx改编为我的母语，并想写一个只用几个单词的演示。有什么办法吗？
speech-recognition 
Speech recognition max/msp/抖动声音-语音分割/识别/分析
speech-recognition 
Speech recognition 书写语音识别引擎
speech-recognition 
Speech recognition pocketsphinx中的段时间戳
speech-recognition 
Speech recognition 在Visual Studio中使用sapi sdk 11进行语音识别太慢
speech-recognition


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R 如何按行分割数据帧，然后处理块？
									R
							 									Dataframe
							 
如何绘制survreg（R的包装存活率）生成的存活曲线？
									R
							 									Plot
							 
将.tps morphometrics文件读入R
									R
							 
在R中合并二元和一元数据集
									R
							 
在R中结合头和尾方法
									R
							 									Dataframe
							 
R 精算生存分析，分为区间
									R
							 									Statistics
							 									Stata
							 
R 如何从数据框中按降序获得前n名公司
									R
							 									Sorting
							 
R ggplot函数选择多个子集
									R
							 
OpenBUGS322到R通信
									R
							 
安装r-base-dev中的问题
									R
							 									Dependencies
							 
如何在纵向数据集中winsorize（或删除单变量异常值）
									R
							 
row.name在子集设置时消失
									R
							 
从car软件包的Anova或Manova函数输出中提取多元检验
									R
							 									Statistics
							 
是否有退出R编程的命令？
									R
							 
在Rmarkdown文档中自动缩放ggplot2的字体大小（等）
									R
							 									Plot
							 
R：从缺少值的列表创建数据帧。
									R
							 									Dataframe
							 
R：使用xtabs创建对称矩阵
									R
							 									Matrix
							 
在R中使用Tidyverse分离数据时遇到问题
									R
							 									Dataframe
							 									Sorting
							 
如何使用R检测字符列中的模式和频率？
									R
							 									Dataframe
							 
R函数，以找到拟合常数的合适值
库（ggplot2）
种子（1）
数据集
									R
							 
如何制作显示R中负值的条形图？
									R
							 
R：箱线图包括-999，定义为NA->；取决于因子声明和NA声明的顺序
									R
							 
unix是否有R dplyr等价物；更多；？
									R
							 
R 使用滞后列的筛选器组
									R
							 
R 将具有不同名称模式的多个.csv文件作为不同的数据帧导入
									R
							 									Import
							 
RStudio和RevealJS:显示选项不起作用
									R
							 
R 对于全球地理点数据集（lat/long），如何找到最近的邻居来解释我们星球的球形性质
									R
							 
R 如何以自定义格式重新构造字符？
									R
							 
R 带有“agnes”的集群：如何获得集群成员资格
									R
							 
R:FitDistributPlus（SGT distribution）中分布的最大似然估计（MLE），如何实现？
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Types
Geolocation
Dataframe
Kentico
Video Streaming
Jhipster
Facebook
Netbeans
Applescript
Drupal 7
Core Data
Hibernate
Django
Google Compute Engine
Synchronization
Openlayers 3
Netlogo
Elm
Log4net
Documentation
C#
Google Cloud Dataflow
Macos
Amp Html
Asp.net Mvc 2
Function
Here Api
Jsp
Single Sign On
Xamarin.ios
Moodle
Visual C++
Dynamic
Azure Cosmosdb
C# 4.0
Dns
Silverlight
Debian
Uwp
Wcf
Server
Gatsby
Websphere
Virtualbox
Jquery Plugins
Twitter
Flash
Vbscript
Django Models
Reporting Services
Css
Gcc
Akka
Rdf
Windows 10
Shiny
Ocaml
Sharepoint
Configuration
Ibm Midrange
Embedded
Google Apps Script
Sql Server 2008 R2
Computer Vision
Keyboard
Asp.net Web Api
Jakarta Ee
Testing
Signalr
Gradle
Swift2
Ip
Vhdl
Xampp
Deployment
Mod Rewrite
Influxdb
Jboss
Docker Compose
Spring Integration
Protocol Buffers
Filesystems
Microservices
Jqgrid
Graphviz
Enums
Binary
Linq
Memory
Windows 8
Tcp
User Interface
Azure Functions
Debugging
Rabbitmq
Dojo
Google Calendar Api
Qml
Soap
Ionic2
File Upload
Directory
Polymer
Firebase
Database
Matplotlib
Nativescript
Backbone.js
Cobol
Jms
Big O
Twig
Rxjs
Fonts
Msbuild
Autodesk Forge
C++ Cli
Xamarin.forms
Pagination
Amazon Redshift
View
Nuget
Wix
Angularjs
Apache Pig
Opencl
Websocket
Cordova
Animation
Centos
Data Structures
Vector
Salesforce
Mapping
Playframework 2.0
Nest
Visual Studio 2015
Dynamics Crm
Pandas
Grid
Mule
Caching
Artifactory
Libgdx
Orientdb
Layout
Ruby On Rails 3.1
Xslt
Activemq
Https
Spring Cloud
Sencha Touch
Perl
Opengl Es
Hyperlink
Validation
Pycharm
D3.js
Visual Studio 2010
Jquery Mobile
Nestjs
Ios7
Chart.js
Ios8
Stream
Antlr
Artificial Intelligence
Ember.js
Regex
Linkedin
Odoo
Inheritance
Java 8
Smtp
Ios4
Forms
Google Chrome
Talend
Eclipse
Data Binding
Monitoring
Java Me
Ibm Mq
Yii
Flask
Snowflake Cloud Data Platform
Svn
Windows Services
Pytorch
Mongoose
Redis
Drools
Plot
Model View Controller
Jestjs
Maven 2
Ssl
Processing
Java
Ios5
Appium


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网