从R中给定的数据集中选择最早的日期
我有一个包含许多行的数据集,但我只选择了一些行,如下所示,只需要在所有行中选择最早的排序,其余的所有变量保持不变从R中给定的数据集中选择最早的日期,r,sorting,date,logic,R,Sorting,Date,Logic,我有一个包含许多行的数据集,但我只选择了一些行,如下所示,只需要在所有行中选择最早的排序,其余的所有变量保持不变 CUST_NO ID_NO SYMBOL AUTO_CREATE_DT CLASS_TYPE SORT_DT 1 107 10120 1 2014-05-12 G/L 2015-01-09 2 107 10120 1 2014-05-12
CUST_NO ID_NO SYMBOL AUTO_CREATE_DT CLASS_TYPE SORT_DT
1 107 10120 1 2014-05-12 G/L 2015-01-09
2 107 10120 1 2014-05-12 G/L 2015-11-10
3 107 10120 1 2014-05-12 G/L 2014-06-18
4 107 10120 1 2014-05-12 G/L 2014-05-12
5 107 10120 1 2014-05-12 G/L 2015-07-10
6 107 10120 1 2014-05-12 G/L 2015-10-09
7 107 10120 1 2014-05-12 G/L 2016-04-08
8 107 10120 1 2014-05-12 G/L 2016-01-08
9 107 10120 1 2014-05-12 G/L 2016-12-22
10 107 10120 1 2014-05-12 G/L 2017-01-13
11 107 10120 1 2014-05-12 G/L 2016-07-08
12 107 10120 1 2014-05-12 G/L 2017-04-14
13 107 10120 1 2014-05-12 G/L 2017-04-17
14 107 10120 1 2014-05-12 G/L 2016-08-31
15 107 10120 1 2014-05-12 G/L 2015-04-10
16 107 10120 1 2014-05-12 G/L 2016-12-22
我需要输出的形式是
CUST_NO ID_NO SYMBOL AUTO_CREATE_DT CLASS_TYPE SORT_DT
1 107 10120 1 2014-05-12 G/L 2014-05-12
请让我知道,如果有人对此有一个解决方案
我还添加了新的数据集
df <- fread("CUST_NO ID_NO SYMBOL AUTO_CREATE_DT CLASS_TYPE SORT_DT
107 10120 1 2014-05-12 G/L 2015-01-09
107 10120 1 2014-05-12 G/L 2015-11-10
107 10120 1 2014-05-12 G/L 2014-06-18
107 10120 1 2014-05-12 G/L 2014-05-13
107 10120 1 2014-05-12 G/L 2015-07-10
107 10120 1 2014-05-12 G/L 2015-10-09
107 10120 1 2014-05-12 G/L 2016-04-08
107 10120 1 2014-05-12 G/L 2016-01-08
107 10120 1 2014-05-12 G/L 2016-12-22
107 10120 1 2014-05-12 G/L 2017-01-13
107 10120 1 2014-05-12 G/L 2016-07-08
108 10120 1 2014-05-12 G/L 2017-04-14
108 10120 1 2014-05-12 G/L 2017-04-17
108 10120 1 2014-05-12 G/L 2016-08-31
108 10120 1 2014-05-12 G/L 2015-04-10
108 10120 1 2014-05-12 G/L 2016-12-22")
尝试聚合
res <- aggregate(SORT_DT ~ CUST_NO + ID_NO + SYMBOL + AUTO_CREATE_DT + CLASS_TYPE, data = df, FUN = min)
res
CUST_NO ID_NO SYMBOL AUTO_CREATE_DT CLASS_TYPE SORT_DT
1 107 10120 1 2014-05-12 G/L 2014-05-13
2 108 10120 1 2014-05-12 G/L 2015-04-10
res试试这个:
aggregate(SORT_DT~.,min,data=df)
输出:
CUST_NO ID_NO SYMBOL AUTO_CREATE_DT CLASS_TYPE SORT_DT
1 107 10120 1 2014-05-12 G/L 2014-05-13
2 108 10120 1 2014-05-12 G/L 2015-04-10
向下投票人:你不能责怪回答者没有注意到OP在答案发布两小时后为问题添加了更多信息。
CUST_NO ID_NO SYMBOL AUTO_CREATE_DT CLASS_TYPE SORT_DT
1 107 10120 1 2014-05-12 G/L 2014-05-13
2 108 10120 1 2014-05-12 G/L 2015-04-10