Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/76.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R:根据之前的数据和id动态聚合_R_Aggregate_Stata - Fatal编程技术网

R:根据之前的数据和id动态聚合

R:根据之前的数据和id动态聚合,r,aggregate,stata,R,Aggregate,Stata,我有一个非常大的数据集,看起来简化如下: row. member_id entry_id comment_count timestamp 1 1 a 4 2008-06-09 12:41:00 2 1 b 1 2008-07-14 18:41:00 3 1 c

我有一个非常大的数据集,看起来简化如下:

row.    member_id   entry_id    comment_count   timestamp
1       1            a              4           2008-06-09 12:41:00
2       1            b              1           2008-07-14 18:41:00
3       1            c              3           2008-07-17 15:40:00
4       2            d              12          2008-06-09 12:41:00
5       2            e              50          2008-09-18 10:22:00
6       3            f              0           2008-10-03 13:36:00
row.    member_id   entry_id    comments_count  timestamp             aggregated_count
1       1            a              4           2008-06-09 12:41:00        4
2       1            b              1           2008-07-14 18:41:00        5
3       1            c              3           2008-07-17 15:40:00        8
4       2            d              12          2008-06-09 12:41:00        12
5       2            e              50          2008-09-18 10:22:00        62
6       3            f              0           2008-10-03 13:36:00        0
现在我想创建一个新的专栏,在这个专栏中,我总结了来自同一位成员的所有先前想法(“ID”)的“共同点”。因此,我只想总结在当前条目之前发生的entried的注释计数。我可以根据成员id和时间戳对数据集进行排序

结果应该如下所示:

row.    member_id   entry_id    comment_count   timestamp
1       1            a              4           2008-06-09 12:41:00
2       1            b              1           2008-07-14 18:41:00
3       1            c              3           2008-07-17 15:40:00
4       2            d              12          2008-06-09 12:41:00
5       2            e              50          2008-09-18 10:22:00
6       3            f              0           2008-10-03 13:36:00
row.    member_id   entry_id    comments_count  timestamp             aggregated_count
1       1            a              4           2008-06-09 12:41:00        4
2       1            b              1           2008-07-14 18:41:00        5
3       1            c              3           2008-07-17 15:40:00        8
4       2            d              12          2008-06-09 12:41:00        12
5       2            e              50          2008-09-18 10:22:00        62
6       3            f              0           2008-10-03 13:36:00        0
你知道我如何在R(或Stata)中做到这一点吗?我尝试了聚合,但我不明白如何只对当前时间戳之前的注释计数和当前成员id的注释计数求和。

试试这个(假设
df
是您的数据)


其他一些方法(为提高效率而引入):

试试这个(假设
df
是您的数据)


其他一些方法(为提高效率而引入):

与Stata一起:

clear
set more off

*----- example data -----

input ///
row    member_id   str1 entry_id    comment_count   str30 timestamp
1       1            a              4           2008-06-09 12:41:00
2       1            b              1           2008-07-14 18:41:00
3       1            c              3           2008-07-17 15:40:00
4       2            d              12          2008-06-09 12:41:00
5       2            e              50          2008-09-18 10:22:00
6       3            f              0           2008-10-03 13:36:00
end

list

*----- what you want -----

bysort member_id: gen s = sum(comment_count)

list
这只涉及使用
by:
前缀。

和Stata:

clear
set more off

*----- example data -----

input ///
row    member_id   str1 entry_id    comment_count   str30 timestamp
1       1            a              4           2008-06-09 12:41:00
2       1            b              1           2008-07-14 18:41:00
3       1            c              3           2008-07-17 15:40:00
4       2            d              12          2008-06-09 12:41:00
5       2            e              50          2008-09-18 10:22:00
6       3            f              0           2008-10-03 13:36:00
end

list

*----- what you want -----

bysort member_id: gen s = sum(comment_count)

list

这只需要使用
by:
前缀。

提供您的数据列表,以便其他人可以处理并回答您的问题。如果没有样本数据,将很难为您提供帮助。请阅读:“包括您尝试过的内容的详细信息”;“不要问你还没有找到答案的问题(展示你的作品!)”。请提供一个最小的、自包含的示例:请参阅、和。向我们展示您尝试过的代码、卡住的地方以及预期的输出。提示:这应该很简单,但不要让其他人想象数据是什么样子。展示给我们。非常感谢你到目前为止的链接。我试图提供一个很好的例子,希望你能帮助我。提供一份你的数据,以便其他人可以在这方面的工作,并回答你的问题。如果没有样本数据,将很难为您提供帮助。请阅读:“包括您尝试过的内容的详细信息”;“不要问你还没有找到答案的问题(展示你的作品!)”。请提供一个最小的、自包含的示例:请参阅、和。向我们展示您尝试过的代码、卡住的地方以及预期的输出。提示:这应该很简单,但不要让其他人想象数据是什么样子。展示给我们。非常感谢你到目前为止的链接。我试图提供一个好的例子,希望你们能帮助我。这就是当你们提供一个可复制的例子和期望的输出时会发生的事情。您在不到5分钟的时间内得到正确答案:)当您提供可复制的示例和所需的输出时,就会发生这种情况。您在不到5分钟内得到正确答案:)