R中显示的额外类别

R中显示的额外类别,r,R,我有一个数据框架,它将印度的英语、印地语、旁遮普语作为分类变量。 但当我跑去查看类别的数量时,它显示: 系数w/4等级:0、英语、印地语、旁遮普语 为什么我得到0?数据集的样本会很有帮助,但通常要彻底查看列中所有可能的类别,必须首先将其转换为字符: unique( as.character(df$column) ) 如果没有关于数据或样本的更多信息,就有点难以准确理解发生了什么。 您是将数据初始化为因子还是自动加载的 以下是我要检查的内容: 1此变量中是否有任何空数据点?可能它们被分配为“0”

我有一个数据框架,它将印度的英语、印地语、旁遮普语作为分类变量。 但当我跑去查看类别的数量时,它显示:

系数w/4等级:0、英语、印地语、旁遮普语


为什么我得到0?

数据集的样本会很有帮助,但通常要彻底查看列中所有可能的类别,必须首先将其转换为字符:

unique( as.character(df$column) )

如果没有关于数据或样本的更多信息,就有点难以准确理解发生了什么。 您是将数据初始化为因子还是自动加载的

以下是我要检查的内容:

1此变量中是否有任何空数据点?可能它们被分配为“0”

2如果数据来源于csv类型文件,请尝试读取不带StringsAsAffactors=FALSE的数据,然后转换变量类型

根据我的经验,有时R在任何非英语的语言中表现得非常奇怪,R中的编码有点弱。也许其他语言有特殊的字符来抵消等级


4尝试查询与“0”匹配的因子。你得到了什么

您是否可以使用dput通过至少一个数据样本?似乎特定列也包含空条目或值为0的行。为什么不使用它来查看哪些行具有该值?它是作为因子自动加载的。1.我查过了。没有空点2。那样读。我就试试看