R将相同的因子值视为不同的值
我是R的一个新用户,试图对我的一个专栏进行子集设置。但是,某些值丢失/未子集到新子集 我尝试了不同的代码拼写变体,但似乎不起作用(即:) 这些代码只产生了7行的子集-->原始数据中应该有37行 当我使用rPivotTable时,它显示了以下内容(Samarinda列出了两次,值分别为30和7): 有人能就如何解决这个问题提出建议吗R将相同的因子值视为不同的值,r,R,我是R的一个新用户,试图对我的一个专栏进行子集设置。但是,某些值丢失/未子集到新子集 我尝试了不同的代码拼写变体,但似乎不起作用(即:) 这些代码只产生了7行的子集-->原始数据中应该有37行 当我使用rPivotTable时,它显示了以下内容(Samarinda列出了两次,值分别为30和7): 有人能就如何解决这个问题提出建议吗 非常感谢如果您确定差异来自字符串边缘的无关字符,则快速获取所需内容的方法是筛选到df$Location包含“Samarinda”的行: df_Location = d
非常感谢如果您确定差异来自字符串边缘的无关字符,则快速获取所需内容的方法是筛选到
df$Location
包含“Samarinda”的行:
df_Location = df[grepl("Samarinda", df$Location),]
如果您需要确切地确定值不同的原因,可以快速查找前导/尾随空格
unique(paste("X", df$Location, "X", sep = ""))
grepping的一种替代方法是通过
trimws
运行字符串,如下所示:
df_Location = df[trimws(df$Location) == "Samarinda",]
在寻求帮助时,您应该包括一个简单的示例输入和所需的输出,可用于测试和验证可能的解决方案。
dput(唯一(df$Location))
返回什么?
unique(paste("X", df$Location, "X", sep = ""))
df_Location = df[trimws(df$Location) == "Samarinda",]