选择在列中具有重复值但在R中重复行的其中一列中具有空白值的特定行
我不熟悉堆栈溢出。如果标题不明白,我很抱歉。下次我会努力做得更好 我有一个数据框,第一列中有重复的值,但它们各自行中的最后一列不同(少数为空,其他可能有一些值)。我一直在试图消除最后一列中带有空白字段的重复项,但每次使用“duplicated()”或“unique()”函数时,我只剩下带有空白字段的行。这是可能发生的,因为行是按这样的方式排序的,即空白字段位于最后一列中具有值的行之上。p> 比如说,, 输入: 我一直得到的输出:选择在列中具有重复值但在R中重复行的其中一列中具有空白值的特定行,r,R,我不熟悉堆栈溢出。如果标题不明白,我很抱歉。下次我会努力做得更好 我有一个数据框,第一列中有重复的值,但它们各自行中的最后一列不同(少数为空,其他可能有一些值)。我一直在试图消除最后一列中带有空白字段的重复项,但每次使用“duplicated()”或“unique()”函数时,我只剩下带有空白字段的行。这是可能发生的,因为行是按这样的方式排序的,即空白字段位于最后一列中具有值的行之上。p> 比如说,, 输入: 我一直得到的输出: *No. per hmm qty* 1
*No. per hmm qty*
1 BARBIE new 1
2 AYLIK * N/A* 1
4 BARB mid 1
期望输出:
*No. per hmm qty*
1 BARBIE new 1
3 AYLIK new 1
4 BARB mid 1
有没有办法指定保留哪一行和删除哪一行
谢谢你的帮助。如果这个问题无法理解,请告诉我。提前谢谢 嗯,不确定这是否是你想要的。这将删除带有NA的所有行
df <- df[complete.cases(df), ]
df也许这对你有用
df <- read.table(text="No. per hmm qty*
1 BARBIE123 new 1
2 AYLIK32 N/A 1
3 AYLIK32 new 1
4 BARB mid 1", header=TRUE, stringsAsFactors=FALSE)
library(dplyr)
df %>%
filter(!duplicated(per, fromLast=TRUE))
# No. per hmm qty.
# 1 1 BARBIE123 new 1
# 2 3 AYLIK32 new 1
# 3 4 BARB mid 1
df%
筛选器(!已复制(per,fromLast=TRUE))
#每个hmm的数量。
#1 1芭比123新1
#2 3 AYLIK32新的1
#3 4倒钩中间1
df <- df[complete.cases(df[,3]), ]
df <- read.table(text="No. per hmm qty*
1 BARBIE123 new 1
2 AYLIK32 N/A 1
3 AYLIK32 new 1
4 BARB mid 1", header=TRUE, stringsAsFactors=FALSE)
library(dplyr)
df %>%
filter(!duplicated(per, fromLast=TRUE))
# No. per hmm qty.
# 1 1 BARBIE123 new 1
# 2 3 AYLIK32 new 1
# 3 4 BARB mid 1