R什么是“什么;表「;应用于两个向量时的命令平均值
首先,可能我不太理解table的概念,如果我在问题中说错了什么,请纠正我 我有一个数据框R什么是“什么;表「;应用于两个向量时的命令平均值,r,R,首先,可能我不太理解table的概念,如果我在问题中说错了什么,请纠正我 我有一个数据框sales,其中包含一些列,其中一个是Style,另一个是TitleCli 当我这样做时:levels(售价$TitleCli) " MISS " " MR " " MRS " "MISS " "MR " "MRS " 当我这样做时:表(售价$TitleCli)我得到了 MISS MR MRS MISS MR MRS 99
sales
,其中包含一些列,其中一个是Style
,另一个是TitleCli
当我这样做时:levels(售价$TitleCli)
" MISS " " MR " " MRS " "MISS " "MR " "MRS "
当我这样做时:表(售价$TitleCli)
我得到了
MISS MR MRS MISS MR MRS
99 186 156 66 140 92
"Adventure" "Children " "Comedy" "Drama" "Horror" "Musical" "Sci-Fi" "Western"
Adventure Children Comedy Drama Horror Musical Sci-Fi Western
47 151 214 94 50 28 92 63
当我这样做时:levels(售价$Style)
MISS MR MRS MISS MR MRS
99 186 156 66 140 92
"Adventure" "Children " "Comedy" "Drama" "Horror" "Musical" "Sci-Fi" "Western"
Adventure Children Comedy Drama Horror Musical Sci-Fi Western
47 151 214 94 50 28 92 63
当我这样做时:table(售价$Style)
MISS MR MRS MISS MR MRS
99 186 156 66 140 92
"Adventure" "Children " "Comedy" "Drama" "Horror" "Musical" "Sci-Fi" "Western"
Adventure Children Comedy Drama Horror Musical Sci-Fi Western
47 151 214 94 50 28 92 63
这是我的问题
当我做表格时(卖$TitleCli,卖$Style)
我说:
我的问题是这些价值观从何而来?它们是同时具有样式值和标题值的行的计数吗
和为什么重复样式的值
更新
这是包含数据帧的文件
您可以通过以下方式将其导入R工作区:sells是的,您是对的,数字是计数。当使用2个向量作为表
的参数时,会得到一个联合分布。akrun指出了修复TitleCli
变量上重复项的方法:
library(stringr)
sells$TitleCli <- str_trim(sells$TitleCli)
应该显示您需要的内容,标题上没有重复项(这一项归功于akrun!)您有MISS
和MR
等的前导/后置空格。因此,“MISS”
与“MISS”
或“MISS”
不同。一旦你纠正了,就不会有重复的。一个选项是库(stringr);出售$TitleCli@akrun您的答案似乎包含了我要求的所有信息。如果您愿意,请键入答案,我感谢您的时间和支持help@akrun如果你想按照保罗的建议做,我可以删除我自己的答案。@DominicComtois没有,你可以用str\u trim
或gsub