Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/68.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/apache-flex/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
从dataframe R中的多个文本组合中选择文本_R_Text_Subset_Tidytext - Fatal编程技术网

从dataframe R中的多个文本组合中选择文本

从dataframe R中的多个文本组合中选择文本,r,text,subset,tidytext,R,Text,Subset,Tidytext,我想根据文本代码对数据进行子集,该代码在df的一列中以多种组合使用。我首先通过创建一个表来检查所有的变化 list <- as.data.frame(table(EQP$col1)) list您可以简单地使用grepl 考虑到您的数据。frame被称为df,要在其上子集的列是col1 df <- data.frame( col1 = c("eraEFC", "dfs", "asdj, aslkj", "dlja,EFC,:LJ)"), stringsAsFact

我想根据文本代码对数据进行子集,该代码在df的一列中以多种组合使用。我首先通过创建一个表来检查所有的变化

 list <-  as.data.frame(table(EQP$col1))

list您可以简单地使用
grepl

考虑到您的
数据。frame
被称为
df
,要在其上子集的列是
col1

df <- data.frame(
    col1 = c("eraEFC", "dfs", "asdj, aslkj", "dlja,EFC,:LJ)"),
    stringsAsFactors = F
)

df[grepl("EFC", df$col1), , drop = F]

df您可以简单地使用
grepl

考虑到您的
数据。frame
被称为
df
,要在其上子集的列是
col1

df <- data.frame(
    col1 = c("eraEFC", "dfs", "asdj, aslkj", "dlja,EFC,:LJ)"),
    stringsAsFactors = F
)

df[grepl("EFC", df$col1), , drop = F]

df除了Gallarus提到的解决方案之外,另一个选择是:

library(stringr)
library(dplyr)
df %>% filter(str_detect(Var1, "EFC"))
正如Sam Firke在这篇文章中所描述的:


除了Gallarus提到的解决方案之外,另一个选择是:

library(stringr)
library(dplyr)
df %>% filter(str_detect(Var1, "EFC"))
正如Sam Firke在这篇文章中所描述的:


您是想对行进行子集划分,还是想做其他事情?您能提供一个子集吗?只需对列1中包含“EFC”(任意组合)的行进行子集设置,您是要对这些行进行子集设置,还是还要执行其他操作?您能否提供一个?只需在1Hi列中提供包含“EFC”(任意组合)的行的子集。我尝试过这个-包'grepl'不可用(对于R版本3.6.1)
grepl
不是一个包,它是一个基本的R函数。你到底试了什么?嗨。我尝试过这个-包'grepl'不可用(对于R版本3.6.1)
grepl
不是一个包,它是一个基本的R函数。你到底尝试了什么?如果你想包含多个“文本”,df%>%过滤器(str_detect(Var1,“EFC”,“ADE”))不起作用…类似df%>%过滤器(str_detect(Var1,pattern=“EFC | ADE”))的东西会起作用(如果你想返回包含这些部分字符串中的任何一个的df。如果你想包含多个“文本”呢,df%>%filter(str_-detect(Var1,“EFC”,“ADE”))不起作用…类似df%>%filter(str_-detect(Var1,pattern=“EFC | ADE”))的东西会起作用(如果要返回包含这些部分字符串中的任何一个的df)。