R将相同的因子值视为不同的值_R

R将相同的因子值视为不同的值

R将相同的因子值视为不同的值,r,R,我是R的一个新用户，试图对我的一个专栏进行子集设置。但是，某些值丢失/未子集到新子集我尝试了不同的代码拼写变体，但似乎不起作用（即：）这些代码只产生了7行的子集-->原始数据中应该有37行当我使用rPivotTable时，它显示了以下内容（Samarinda列出了两次，值分别为30和7）：有人能就如何解决这个问题提出建议吗非常感谢如果您确定差异来自字符串边缘的无关字符，则快速获取所需内容的方法是筛选到df$Location包含“Samarinda”的行： df_Location = d

我是R的一个新用户，试图对我的一个专栏进行子集设置。但是，某些值丢失/未子集到新子集

我尝试了不同的代码拼写变体，但似乎不起作用（即：）

这些代码只产生了7行的子集-->原始数据中应该有37行

当我使用rPivotTable时，它显示了以下内容（Samarinda列出了两次，值分别为30和7）：

有人能就如何解决这个问题提出建议吗

非常感谢

如果您确定差异来自字符串边缘的无关字符，则快速获取所需内容的方法是筛选到

df$Location

包含“Samarinda”的行：

df_Location = df[grepl("Samarinda", df$Location),]

如果您需要确切地确定值不同的原因，可以快速查找前导/尾随空格

unique(paste("X", df$Location, "X", sep = ""))

grepping的一种替代方法是通过

trimws

运行字符串，如下所示：

df_Location = df[trimws(df$Location) == "Samarinda",]

在寻求帮助时，您应该包括一个简单的示例输入和所需的输出，可用于测试和验证可能的解决方案。

dput（唯一（df$Location））

返回什么？

unique(paste("X", df$Location, "X", sep = ""))

df_Location = df[trimws(df$Location) == "Samarinda",]