添加新列,将值与带dplyr的字符串相乘

添加新列,将值与带dplyr的字符串相乘,r,dataframe,dplyr,R,Dataframe,Dplyr,有些人告诉我,我怎么能不去想一个简单的问题。如何计算times(*)中字符串值的数量另一列times\u使用的整数。可能与group_by()和summary()?使用以下数据帧: word times_used sentiment <chr> <int> <chr> 1 fake 68 negative 2 bad 36 negative 3 pr

有些人告诉我,我怎么能不去想一个简单的问题。如何计算
times(*)中字符串值的数量另一列
times\u使用的整数。可能与
group_by()
summary()
?使用以下数据帧:

        word times_used sentiment
       <chr>      <int>     <chr>
 1      fake         68  negative
 2       bad         36  negative
 3 president         35  positive
 4       tax         32  negative
 5   failing         21  negative
 6      vote         20  negative
 7      vote         20  positive
 8      deal         19  positive
 9       job         19  positive
10    united         19  positive
# ... with 475 more rows
wordtimes\u使用
1假68负
2坏36负
3主席:35积极
4税项32负
5.21负
6票20票反对
7票赞成,20票赞成
8交易19积极
9职务19积极
10曼联19正
# ... 还有475行
最终寻找类似的东西:

times_used sentiment
     <int>     <chr>
      4090  negative
      3198  positive
times\u
4090负
3198阳性

如果我理解正确,您可能会想要:

library(dplyr)
df %>%
 group_by(sentiment) %>%
 summarise(count = n(),
           words = sum(times_used)) %>%
 mutate(total = count * words)
#  A tibble: 2 x 4
#  sentiment count words total
#     <fctr> <int> <int> <int>
#1  negative     5   177   885
#2  positive     5   112   560
库(dplyr)
df%>%
组别(情绪)%>%
汇总(计数=n(),
字=总和(使用次数))%>%
变异(总数=计数*字)
#一个tibble:2x4
#感情数字总数
#        
#1负5 177 885
#2正5 112 560
然后,如果您只需要这两列,您可以链接
选择(情绪,总计)