R fct_崩溃的否定级别

R fct_崩溃的否定级别,r,forcats,negate,R,Forcats,Negate,我有一个不应该崩溃的级别列表(“阿尔伯塔”、“不列颠哥伦比亚”、“安大略”、“魁北克”),比应该崩溃的级别列表(所有其他级别)要小。我无法否定fct_崩溃的级别(代码作为目标的示例)(除了以下内容之外)。有什么建议吗 df$`Province group`%%fct\u collapse(df$Province,`较小的省份`=!c(“阿尔伯塔省”、“不列颠哥伦比亚省”、“安大略省”、“魁北克省”)我对您在这里使用的一些语法感到有点困惑,但这个解决方案应该适合您!它使用dplyr的管道结构,在变

我有一个不应该崩溃的级别列表(“阿尔伯塔”、“不列颠哥伦比亚”、“安大略”、“魁北克”),比应该崩溃的级别列表(所有其他级别)要小。我无法否定fct_崩溃的级别(代码作为目标的示例)(除了以下内容之外)。有什么建议吗


df$`Province group`%%fct\u collapse(df$Province,`较小的省份`=!c(“阿尔伯塔省”、“不列颠哥伦比亚省”、“安大略省”、“魁北克省”)

我对您在这里使用的一些语法感到有点困惑,但这个解决方案应该适合您!它使用dplyr的管道结构,在变量名中使用下划线而不是空格(即变量名而不是“变量名”)

库(dplyr)
图书馆(供猫用)
#我想象您的df$Province变量是什么样子的

df我对您在这里使用的一些语法感到有点困惑,但是这个解决方案应该适合您!它使用dplyr的管道结构,在变量名中使用下划线而不是空格(即变量名而不是“变量名”)

库(dplyr)
图书馆(供猫用)
#我想象您的df$Province变量是什么样子的

df这里有一个具有
级别的解决方案
以获得因子的级别。然后,通过对%
中的
%求反,对不折叠的值进行子集设置

首先在用户的答案中重新创建

library(magrittr)
library(dplyr)
library(forcats)

df <- tibble(Province = rep(c("Ontario", "Alberta", "Quebec", "British Columbia", "PEI", "Manitoba", "Nova Scotia"), 10))
df$Province <- factor(df$Province)
库(magrittr)
图书馆(dplyr)
图书馆(供猫用)

df这里有一个具有
级别的解决方案
以获得因子的级别。然后,通过对%
中的
%求反,对不折叠的值进行子集设置

首先在用户的答案中重新创建

library(magrittr)
library(dplyr)
library(forcats)

df <- tibble(Province = rep(c("Ontario", "Alberta", "Quebec", "British Columbia", "PEI", "Manitoba", "Nova Scotia"), 10))
df$Province <- factor(df$Province)
库(magrittr)
图书馆(dplyr)
图书馆(供猫用)
df是这个问题的最佳解决方案(只是因为问题的逻辑是否定4个大n省)。如果有人找到比鲁伊·巴拉达斯更短的解决方案,我仍然对未来的因子工作感兴趣

df%>%
  mutate(`Compared to smaller provinces` = fct_lump(Province, n = 4)) %>%
  count(`Compared to smaller provinces`)
这产生了5组,其中“其他”是所有其他较小的n响应省份。

是解决此问题的最佳方案(只是因为问题的逻辑是否定4个较大的n响应省份)。如果有人找到比鲁伊·巴拉达斯更短的解决方案,我仍然对未来的因子工作感兴趣

df%>%
  mutate(`Compared to smaller provinces` = fct_lump(Province, n = 4)) %>%
  count(`Compared to smaller provinces`)
这产生了5组,其中“其他”是所有其他较小的n响应省份