R 考虑NA作为多变量的因子水平

R 考虑NA作为多变量的因子水平,r,missing-data,categorical-data,R,Missing Data,Categorical Data,我试图在一个大的分类数据集上运行k-modes 每个变量中有几个NA,但我想保留这些信息,因为对我来说这是有意义的 K模式对于NAs的数据集不起作用,因此,我寻找一种快速的方法来考虑所有变量中的所有NA。 我读过很多问题,但答案只适用于按姓名命名的方式 有没有使用R的建议 mydf <- data.frame(a = factor(c("a", NA, NA)), b = factor(c("b", NA, NA)), c = factor(c("yo", NA, NA))) mydf

我试图在一个大的分类数据集上运行k-modes

每个变量中有几个NA,但我想保留这些信息,因为对我来说这是有意义的

K模式对于NAs的数据集不起作用,因此,我寻找一种快速的方法来考虑所有变量中的所有NA。 我读过很多问题,但答案只适用于按姓名命名的方式

有没有使用R的建议

mydf <- data.frame(a = factor(c("a", NA, NA)), b = factor(c("b", NA, NA)), c = factor(c("yo", NA, NA)))
mydf试试这个:

mydf <- data.frame(a = factor(c("a", NA, NA)), b = factor(c("b", NA, NA)), c = factor(c("yo", NA, NA)))
试试这个:

mydf <- data.frame(a = factor(c("a", NA, NA)), b = factor(c("b", NA, NA)), c = factor(c("yo", NA, NA)))


您能将所有NA值分配给与所有其他数据不相关的任意数字吗?i、 e.
mydf[is.na(mydf)]因为这种方法不起作用,在什么意义上它不起作用?请自己尝试一下,在您进行必要的转换以操作数据之前,这种方法确实起作用。我不是在提供答案,只是一个建议。你能把所有的NA值分配给一个与所有其他数据无关的任意数字吗?i、 e.
mydf[is.na(mydf)]因为这种方法不起作用,在什么意义上它不起作用?请自己尝试一下,在您进行必要的转换以操作数据之前,这种方法确实起作用。我不是在提供答案,只是一个建议。所以我说的正是,但经过一步一步的解释,P也说这种方法不起作用,所以我们应该在收到更多信息之前不要急于下结论。Sam方法不包括
mydf,所以正是我说的,但是随着逐步解释,P也说这种方法不起作用,所以我们应该在收到更多信息之前不要急于下结论。Sam方法不包括
mydf
mydf[is.na(mydf)]<-"Something"
mydf <- data.frame(lapply(mydf, as.character), stringsAsFactors=TRUE)
factor(mydf$a)
[1] a         Something Something
Levels: a Something