R 基于年份的多个条件总结
我想根据每年的论文数量创建一组专栏,从而通过总结过滤dplyr中的多个条件: 这是我的代码:R 基于年份的多个条件总结,r,dplyr,R,Dplyr,我想根据每年的论文数量创建一组专栏,从而通过总结过滤dplyr中的多个条件: 这是我的代码: words_list <- data %>% select(Keywords, year) %>% unnest_tokens(word, Keywords) %>% filter(between(year,1990,2017)) %>% group_by(word) %>% summarise(papers_count = n()
words_list <- data %>%
select(Keywords, year) %>%
unnest_tokens(word, Keywords) %>%
filter(between(year,1990,2017)) %>%
group_by(word) %>%
summarise(papers_count = n()) %>%
arrange(desc(papers_count))
单词列表%
选择(关键字,年份)%>%
unnest_标记(单词、关键字)%%>%
过滤器(介于(19902017年)之间)%>%
分组依据(字)%>%
总结(论文数量=n())%>%
安排(描述(论文数量))
上面的代码为我提供了两个栏,“word”和“papers_count”,我想根据1990年到2017年之间的每年创建更多栏,如papers_count(papers_count1990,papers_count1991,等等)
我正在寻找这样的东西:
words_list <- data %>%
select(Keywords, year) %>%
unnest_tokens(word, Keywords) %>%
filter(between(year,1990,2017)) %>%
group_by(word) %>%
summarise(tot_papers_count = n(), papers_count_1991 = n()year="1991", ...) %>%
arrange(desc(papers_count))
单词列表%
选择(关键字,年份)%>%
unnest_标记(单词、关键字)%%>%
过滤器(介于(19902017年)之间)%>%
分组依据(字)%>%
总结(总论文数=n(),论文数=n()year=“1991”,…)%>%
安排(描述(论文数量))
有人有什么建议吗?我建议将
年份添加到组中,然后使用排列创建多个摘要列
library(tidyr)
words_list_by_year <- data %>%
select(Keywords, year) %>%
unnest_tokens(word, Keywords) %>%
filter(between(year,1990,2017)) %>%
group_by(year,word) %>%
summarise(papers_count = n()) %>%
spread(year,papers_count,fill=0)
library(tidyr)
按年份列出的单词百分比
选择(关键字,年份)%>%
unnest_标记(单词、关键字)%%>%
过滤器(介于(19902017年)之间)%>%
分组单位(年,字)%>%
总结(论文数量=n())%>%
排列(年份、论文数、填充=0)
请给出一个小的可复制示例和预期输出