从R中的巨大数据帧中识别和选择单个元素_R_Dataframe_Gsub

从R中的巨大数据帧中识别和选择单个元素

r dataframe

从R中的巨大数据帧中识别和选择单个元素,r,dataframe,gsub,R,Dataframe,Gsub,我在R中有以下数据框： V1 V2 V3 A 3.5 - 5.5 2 B 3.5 - 5.5 2.2 - 5.0 C 18 - 25 3.5 D 0.6 - 1.5 3 - 4.7 E 30 2.3 - 3 F 11.0 - 13.0 1 G 6.5 - 8.5 3 - 5 H 16 - 19 4 -

我在R中有以下数据框：

V1    V2             V3
A     3.5 - 5.5      2
B     3.5 - 5.5      2.2 - 5.0 
C     18 - 25        3.5
D     0.6 - 1.5      3 - 4.7
E     30             2.3 - 3 
F     11.0 - 13.0    1
G     6.5 - 8.5      3 - 5
H     16 - 19        4 - 10
I     1.5 - 2.0      2
J     11.0 - 14.0    3
K     1.2            5
L     32             7
M     31             8

列表非常庞大（>100000行）。我想识别数据帧中包含单个数字的所有行，然后生成第二个数据帧，如：

以及：

选择单个数字行的最佳方法是什么？我正在尝试使用gsub命令解决问题，但没有成功。

查找连字符并否定它

grepl（）

可以很好地解决这个问题

df[!grepl("-", df$V2, fixed = TRUE), -3]
#    V1  V2
# 5   E  30
# 11  K 1.2
# 12  L  32
# 13  M  31

对于

V3

（带

-2

）也一样

更新：正如Frank所指出的，您可以使用

is.na（）

来实现这一点，实际上，如果您打算将数据用于计算，最好还是将其强制为数字。在这种情况下，如果

V2

和

V3

是因素，您可以这样做

df[-1] <- lapply(df[-1], function(x) as.numeric(levels(x))[x])

。。。等等。

或

！is.na（如.numeric（df$V2））

？或

grep（…，invert=TRUE）

df[!grepl("-", df$V3, fixed = TRUE), -2]
#    V1  V3
# 1   A   2
# 3   C 3.5
# 6   F   1
# 9   I   2
# 10  J   3
# 11  K   5
# 12  L   7
# 13  M   8

df[-1] <- lapply(df[-1], function(x) as.numeric(levels(x))[x])

df[-1] <- lapply(df[-1], as.numeric)

df[!is.na(df$V2), -3]
#    V1   V2
# 5   E 30.0
# 11  K  1.2
# 12  L 32.0
# 13  M 31.0