Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/79.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
选择在列中具有重复值但在R中重复行的其中一列中具有空白值的特定行_R - Fatal编程技术网

选择在列中具有重复值但在R中重复行的其中一列中具有空白值的特定行

选择在列中具有重复值但在R中重复行的其中一列中具有空白值的特定行,r,R,我不熟悉堆栈溢出。如果标题不明白,我很抱歉。下次我会努力做得更好 我有一个数据框,第一列中有重复的值,但它们各自行中的最后一列不同(少数为空,其他可能有一些值)。我一直在试图消除最后一列中带有空白字段的重复项,但每次使用“duplicated()”或“unique()”函数时,我只剩下带有空白字段的行。这是可能发生的,因为行是按这样的方式排序的,即空白字段位于最后一列中具有值的行之上。p> 比如说,, 输入: 我一直得到的输出: *No. per hmm qty* 1

我不熟悉堆栈溢出。如果标题不明白,我很抱歉。下次我会努力做得更好

我有一个数据框,第一列中有重复的值,但它们各自行中的最后一列不同(少数为空,其他可能有一些值)。我一直在试图消除最后一列中带有空白字段的重复项,但每次使用“duplicated()”或“unique()”函数时,我只剩下带有空白字段的行。这是可能发生的,因为行是按这样的方式排序的,即空白字段位于最后一列中具有值的行之上。p> 比如说,, 输入:

我一直得到的输出:

*No.   per      hmm        qty*
1    BARBIE    new         1
2    AYLIK   * N/A*        1
4     BARB     mid         1
期望输出:

*No.   per      hmm        qty*
1     BARBIE    new         1
3     AYLIK     new         1
4     BARB      mid         1
有没有办法指定保留哪一行和删除哪一行


谢谢你的帮助。如果这个问题无法理解,请告诉我。提前谢谢

嗯,不确定这是否是你想要的。这将删除带有NA的所有行

df <- df[complete.cases(df), ]

df也许这对你有用

df <- read.table(text="No.   per         hmm        qty*
1    BARBIE123     new         1
2    AYLIK32       N/A        1
3    AYLIK32       new         1
4     BARB         mid         1", header=TRUE, stringsAsFactors=FALSE)

library(dplyr)
df %>%
  filter(!duplicated(per, fromLast=TRUE))

  # No.       per hmm qty.
# 1   1 BARBIE123 new    1
# 2   3   AYLIK32 new    1
# 3   4      BARB mid    1
df%
筛选器(!已复制(per,fromLast=TRUE))
#每个hmm的数量。
#1 1芭比123新1
#2 3 AYLIK32新的1
#3 4倒钩中间1
df <- df[complete.cases(df[,3]), ]
df <- read.table(text="No.   per         hmm        qty*
1    BARBIE123     new         1
2    AYLIK32       N/A        1
3    AYLIK32       new         1
4     BARB         mid         1", header=TRUE, stringsAsFactors=FALSE)

library(dplyr)
df %>%
  filter(!duplicated(per, fromLast=TRUE))

  # No.       per hmm qty.
# 1   1 BARBIE123 new    1
# 2   3   AYLIK32 new    1
# 3   4      BARB mid    1