Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/multithreading/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 查找并替换特定图案_R - Fatal编程技术网

R 查找并替换特定图案

R 查找并替换特定图案,r,R,我有一个大data.frame,其中第一列如下所示: 上校 ELOVL6 ELOVL7 ELP2 EMC1包括例如:23065 EPT1包括EG:28042 ZEB1包括EG:29009 我想删除所有包含的内容,例如:。。。要获得以下输出: 上校 ELOVL6 ELOVL7 ELP2 EMC1 EPT1 ZEB1 有什么建议吗 提前多谢 I suppose y your column of the data.frame sapply(as.list(y),function(x){gsub(

我有一个大data.frame,其中第一列如下所示:

上校 ELOVL6 ELOVL7 ELP2 EMC1包括例如:23065 EPT1包括EG:28042 ZEB1包括EG:29009

我想删除所有包含的内容,例如:。。。要获得以下输出:

上校 ELOVL6 ELOVL7 ELP2 EMC1 EPT1 ZEB1

有什么建议吗

提前多谢

 I suppose y your column of the data.frame

 sapply(as.list(y),function(x){gsub("(.*)\\(.*\\)", "\\1", x)})
编辑

更简单

 gsub("(.*)\\(.*\\)", "\\1", x)
编辑

更简单

 gsub("(.*)\\(.*\\)", "\\1", x)

你是说像这样的

COL <- c("ELOVL7",
         "ELP2",
         "EMC1 (includes EG:23065)",
         "EPT1 (includes EG:28042)",
         "ZEB1 (includes EG:29009)")

COL <- data.frame(COL)
data.frame(COL=sapply(strsplit(as.character(COL[,1]), split=" "), '[', 1))
     COL
1 ELOVL7
2   ELP2
3   EMC1
4   EPT1
5   ZEB1

你是说像这样的

COL <- c("ELOVL7",
         "ELP2",
         "EMC1 (includes EG:23065)",
         "EPT1 (includes EG:28042)",
         "ZEB1 (includes EG:29009)")

COL <- data.frame(COL)
data.frame(COL=sapply(strsplit(as.character(COL[,1]), split=" "), '[', 1))
     COL
1 ELOVL7
2   ELP2
3   EMC1
4   EPT1
5   ZEB1

请输入您的数据,请?dputtmp1 structurelistSymbol=structurec2L,2L,2L,2L,2L,3806L,3806L,3806L,14971L,14971L,14971L,14976L,14978L,14978L,14978L,…,class=factor,.Names=Symbol,class=data.frame,row.Names=cNA,-54613l请输入您的数据,请,3806L,3806L,14971L,14971L,14976L,14978L,14978L,…,class=factor,.Names=Symbol,class=data.frame,row.Names=cNA,-54613L似乎没有必要?gsub是矢量化的。sapply似乎没有必要?gsub是矢量化的。