R 考虑NA作为多变量的因子水平_R_Missing Data_Categorical Data

R 考虑NA作为多变量的因子水平

R 考虑NA作为多变量的因子水平,r,missing-data,categorical-data,R,Missing Data,Categorical Data,我试图在一个大的分类数据集上运行k-modes 每个变量中有几个NA，但我想保留这些信息，因为对我来说这是有意义的 K模式对于NAs的数据集不起作用，因此，我寻找一种快速的方法来考虑所有变量中的所有NA。我读过很多问题，但答案只适用于按姓名命名的方式有没有使用R的建议 mydf <- data.frame(a = factor(c("a", NA, NA)), b = factor(c("b", NA, NA)), c = factor(c("yo", NA, NA))) mydf

我试图在一个大的分类数据集上运行k-modes

每个变量中有几个NA，但我想保留这些信息，因为对我来说这是有意义的

K模式对于NAs的数据集不起作用，因此，我寻找一种快速的方法来考虑所有变量中的所有NA。我读过很多问题，但答案只适用于按姓名命名的方式

有没有使用R的建议

mydf <- data.frame(a = factor(c("a", NA, NA)), b = factor(c("b", NA, NA)), c = factor(c("yo", NA, NA)))

mydf试试这个：
mydf <- data.frame(a = factor(c("a", NA, NA)), b = factor(c("b", NA, NA)), c = factor(c("yo", NA, NA)))

试试这个：
mydf <- data.frame(a = factor(c("a", NA, NA)), b = factor(c("b", NA, NA)), c = factor(c("yo", NA, NA)))

您能将所有NA值分配给与所有其他数据不相关的任意数字吗？i、 e.mydf[is.na（mydf）]因为这种方法不起作用，在什么意义上它不起作用？请自己尝试一下，在您进行必要的转换以操作数据之前，这种方法确实起作用。我不是在提供答案，只是一个建议。你能把所有的NA值分配给一个与所有其他数据无关的任意数字吗？i、 e.mydf[is.na（mydf）]因为这种方法不起作用，在什么意义上它不起作用？请自己尝试一下，在您进行必要的转换以操作数据之前，这种方法确实起作用。我不是在提供答案，只是一个建议。所以我说的正是，但经过一步一步的解释，P也说这种方法不起作用，所以我们应该在收到更多信息之前不要急于下结论。Sam方法不包括mydf，所以正是我说的，但是随着逐步解释，P也说这种方法不起作用，所以我们应该在收到更多信息之前不要急于下结论。Sam方法不包括mydf
mydf[is.na(mydf)]<-"Something"

mydf <- data.frame(lapply(mydf, as.character), stringsAsFactors=TRUE)

factor(mydf$a)
[1] a         Something Something
Levels: a Something