R 尝试将具有相似前缀的分类变量分组
我相信我的问题很简单。我希望能够将数据框架中的分类变量分组到一个更大的单元中。比如说R 尝试将具有相似前缀的分类变量分组,r,R,我相信我的问题很简单。我希望能够将数据框架中的分类变量分组到一个更大的单元中。比如说 lifestyle.travel.europe lifestyle.travel.long-haul lifestyle.travel.ireland lifestyle.fashion 我想把自己分为生活
lifestyle.travel.europe
lifestyle.travel.long-haul
lifestyle.travel.ireland
lifestyle.fashion
我想把自己分为生活方式组,或者生活方式旅行组。谢谢你的帮助
编辑:对不起,我忘了加上我想把这些加在它们的计数中,所以如果上面列出的4个有1个观察值,那么我希望我的最终输出有
category n
lifestyle 4
一个选项是
word
fromstringr
library(stringr)
word(df1$Column, 1, sep=".")
或者另一个选项是删除从第一个
开始的字符
sub("\\..*", "", df1$column)
您可以使用substr
函数提取所需的子字符串。比如,
cat <- substr(iris$Species, 1, 2)
也许您需要sub(“\\..*”,“”,df1$列)
cat <- as.factor(cat)
levels(cat)
# "se" "ve" "vi"
table(cat)
# cat
# se ve vi
# 50 50 50