计算R中的行时按日期分组出现问题
我使用的是唐纳德·特朗普推特的公共数据集,可以在这里找到: 在这样做之后,我尝试在R中按日期进行分组。首先,我想统计公关日的推特数量,其次,我想总结公关日的“热门”和“转发” 我已经写了以下代码,但它总是给我错误。。。你能帮我吗 提前谢谢计算R中的行时按日期分组出现问题,r,date,dataframe,dplyr,grouping,R,Date,Dataframe,Dplyr,Grouping,我使用的是唐纳德·特朗普推特的公共数据集,可以在这里找到: 在这样做之后,我尝试在R中按日期进行分组。首先,我想统计公关日的推特数量,其次,我想总结公关日的“热门”和“转发” 我已经写了以下代码,但它总是给我错误。。。你能帮我吗 提前谢谢 Donald <- read_csv(file="Donald-Tweets!.csv") Donald #Grouped G_filter <- Donald %>% select(Date,twt_favourites_IS_TH
Donald <- read_csv(file="Donald-Tweets!.csv")
Donald
#Grouped
G_filter <- Donald %>%
select(Date,twt_favourites_IS_THIS_LIKE_QUESTION_MARK, Retweets) %>%
rename( Favourites = twt_favourites_IS_THIS_LIKE_QUESTION_MARK) %>%
group_by(as.Date.date(Date)) %>%
summarise(Total = sum(Favourites+Retweets), count(n))
View(G_filter)
Donald%
重命名(Favorites=twt\u Favorites\u是\u这个\u像\u问号)%>%
分组人(截止日期日期)(日期))%>%
总结(总计=总计(收藏夹+转发),计数(n))
视图(G_过滤器)
这可能就是您要找的
library(tidyverse)
G_filter <- Donald %>%
select(Date, twt_favourites_IS_THIS_LIKE_QUESTION_MARK, Retweets) %>%
rename(Favourites = twt_favourites_IS_THIS_LIKE_QUESTION_MARK) %>%
group_by(Date) %>%
mutate(Favorites_and_Retweets = Favourites + Retweets) %>%
summarise(Favorites_and_Retweets = sum(Favorites_and_Retweets),
Count = n())
G_filter
# # A tibble: 479 x 3
# Date Favorites_and_Retweets Count
# <chr> <int> <int>
# 1 15-07-16 66899 39
# 2 15-07-17 65212 22
# 3 15-07-18 97381 32
# 4 15-07-19 34229 12
# 5 15-07-20 62316 37
# 6 15-07-21 88132 62
# 7 15-07-22 69919 37
# 8 15-07-23 67963 43
# 9 15-07-24 67687 35
# 10 15-07-25 39744 25
# # ... with 469 more rows
库(tidyverse)
G_过滤器%
选择(日期、twt\U收藏夹\U是\U此\U类似\U问号、转发)%>%
重命名(Favorites=twt\u Favorites\u是\u这个\u像\u问号)%>%
分组单位(日期)%>%
变异(收藏夹和转发=收藏夹+转发)%>%
总结(收藏夹和转发=sum(收藏夹和转发),
计数=n()
G_滤波器
##A tibble:479 x 3
#日期收藏夹和转发计数
#
# 1 15-07-16 66899 39
# 2 15-07-17 65212 22
# 3 15-07-18 97381 32
# 4 15-07-19 34229 12
# 5 15-07-20 62316 37
# 6 15-07-21 88132 62
# 7 15-07-22 69919 37
# 8 15-07-23 67963 43
# 9 15-07-24 67687 35
# 10 15-07-25 39744 25
# # ... 还有469行
不需要转换
日期
列。如果您真的想这样做,一种方法是加载lubridate
包,然后在管道中执行mutate(Date=ymd(Date))
。什么是as.Date.Date
?另外,一些示例数据可能会有所帮助,这将让我们看看调用as.Date()
是否有意义。"... 但是它总是给我错误……”你应该明确错误信息。错误信息通常提供建设性的反馈。