添加新列,将值与带dplyr的字符串相乘
有些人告诉我,我怎么能不去想一个简单的问题。如何计算添加新列,将值与带dplyr的字符串相乘,r,dataframe,dplyr,R,Dataframe,Dplyr,有些人告诉我,我怎么能不去想一个简单的问题。如何计算times(*)中字符串值的数量另一列times\u使用的整数。可能与group_by()和summary()?使用以下数据帧: word times_used sentiment <chr> <int> <chr> 1 fake 68 negative 2 bad 36 negative 3 pr
times(*)中字符串值的数量另一列times\u使用的整数。可能与group_by()
和summary()
?使用以下数据帧:
word times_used sentiment
<chr> <int> <chr>
1 fake 68 negative
2 bad 36 negative
3 president 35 positive
4 tax 32 negative
5 failing 21 negative
6 vote 20 negative
7 vote 20 positive
8 deal 19 positive
9 job 19 positive
10 united 19 positive
# ... with 475 more rows
wordtimes\u使用
1假68负
2坏36负
3主席:35积极
4税项32负
5.21负
6票20票反对
7票赞成,20票赞成
8交易19积极
9职务19积极
10曼联19正
# ... 还有475行
最终寻找类似的东西:
times_used sentiment
<int> <chr>
4090 negative
3198 positive
times\u
4090负
3198阳性
如果我理解正确,您可能会想要:
library(dplyr)
df %>%
group_by(sentiment) %>%
summarise(count = n(),
words = sum(times_used)) %>%
mutate(total = count * words)
# A tibble: 2 x 4
# sentiment count words total
# <fctr> <int> <int> <int>
#1 negative 5 177 885
#2 positive 5 112 560
库(dplyr)
df%>%
组别(情绪)%>%
汇总(计数=n(),
字=总和(使用次数))%>%
变异(总数=计数*字)
#一个tibble:2x4
#感情数字总数
#
#1负5 177 885
#2正5 112 560
然后,如果您只需要这两列,您可以链接选择(情绪,总计)