选择在列中具有重复值但在R中重复行的其中一列中具有空白值的特定行_R

选择在列中具有重复值但在R中重复行的其中一列中具有空白值的特定行

选择在列中具有重复值但在R中重复行的其中一列中具有空白值的特定行,r,R,我不熟悉堆栈溢出。如果标题不明白，我很抱歉。下次我会努力做得更好我有一个数据框，第一列中有重复的值，但它们各自行中的最后一列不同（少数为空，其他可能有一些值）。我一直在试图消除最后一列中带有空白字段的重复项，但每次使用“duplicated（）”或“unique（）”函数时，我只剩下带有空白字段的行。这是可能发生的，因为行是按这样的方式排序的，即空白字段位于最后一列中具有值的行之上。p> 比如说,，输入：我一直得到的输出： *No. per hmm qty* 1

我不熟悉堆栈溢出。如果标题不明白，我很抱歉。下次我会努力做得更好

我有一个数据框，第一列中有重复的值，但它们各自行中的最后一列不同（少数为空，其他可能有一些值）。我一直在试图消除最后一列中带有空白字段的重复项，但每次使用“duplicated（）”或“unique（）”函数时，我只剩下带有空白字段的行。这是可能发生的，因为行是按这样的方式排序的，即空白字段位于最后一列中具有值的行之上。p> 比如说,，输入：

我一直得到的输出：

*No.   per      hmm        qty*
1    BARBIE    new         1
2    AYLIK   * N/A*        1
4     BARB     mid         1

期望输出：

*No.   per      hmm        qty*
1     BARBIE    new         1
3     AYLIK     new         1
4     BARB      mid         1

有没有办法指定保留哪一行和删除哪一行

谢谢你的帮助。如果这个问题无法理解，请告诉我。提前谢谢

嗯，不确定这是否是你想要的。这将删除带有NA的所有行

df <- df[complete.cases(df), ]

df也许这对你有用
df <- read.table(text="No.   per         hmm        qty*
1    BARBIE123     new         1
2    AYLIK32       N/A        1
3    AYLIK32       new         1
4     BARB         mid         1", header=TRUE, stringsAsFactors=FALSE)

library(dplyr)
df %>%
  filter(!duplicated(per, fromLast=TRUE))

  # No.       per hmm qty.
# 1   1 BARBIE123 new    1
# 2   3   AYLIK32 new    1
# 3   4      BARB mid    1

df%
筛选器（！已复制（per，fromLast=TRUE））
#每个hmm的数量。
#1 1芭比123新1
#2 3 AYLIK32新的1
#3 4倒钩中间1

df <- df[complete.cases(df[,3]), ]

df <- read.table(text="No.   per         hmm        qty*
1    BARBIE123     new         1
2    AYLIK32       N/A        1
3    AYLIK32       new         1
4     BARB         mid         1", header=TRUE, stringsAsFactors=FALSE)

library(dplyr)
df %>%
  filter(!duplicated(per, fromLast=TRUE))

  # No.       per hmm qty.
# 1   1 BARBIE123 new    1
# 2   3   AYLIK32 new    1
# 3   4      BARB mid    1