R ddply摘要字符串操作
我现在正在使用R ddply摘要字符串操作,r,plyr,R,Plyr,我现在正在使用ddply。处理数字很容易。例如,取子群的平均值或标准偏差 但是我很难处理字符串。我想在每个子组的同一列中组合字符串,但我不能这样做。我尝试了cbind粘贴等。任何人都可以提供一些帮助?在粘贴语句中添加collapse=“” ddply(mtcars, .(carb), summarize, cyl_concatenated = paste(cyl, collapse = "")) # carb cyl_concatenated #1 1 4664444
ddply
。处理数字很容易。例如,取子群的平均值或标准偏差
但是我很难处理字符串。我想在每个子组的同一列中组合字符串,但我不能这样做。我尝试了cbind
粘贴
等。任何人都可以提供一些帮助?在粘贴语句中添加collapse=“”
ddply(mtcars, .(carb), summarize, cyl_concatenated = paste(cyl, collapse = ""))
# carb cyl_concatenated
#1 1 4664444
#2 2 8444888444
#3 3 888
#4 4 6686688888
#5 6 6
#6 8 8
我知道Dason有办法。我宁愿把事情分开,并建议:
ddply(mtcars, .(carb), summarize, cyl_list = list(as.character(cyl)))
#-----------
carb cyl_list
1 1 4, 6, 6, 4, 4, 4, 4
2 2 8, 4, 4, 4, 8, 8, 8, 4, 4, 4
3 3 8, 8, 8
4 4 6, 6, 8, 6, 6, 8, 8, 8, 8, 8
5 6 6
6 8 8
您还可以修改Dason的使用collapse=“,”,它看起来与上面相同,但结构不同。使用
list()
您需要在使用该示例时将其转换为字符,否则您将得到因子变量的整数编码。如果没有具体的、可复制的示例,则不,我们可能无法提供太多帮助。请提供一个示例以获取帮助。。。