从R中的数据集筛选@domain.edu

从R中的数据集筛选@domain.edu,r,R,我有一个电子邮件列表,如下所示: emails <- c("john.doe@ivyleague.edu", "education@world.gov", "dalai.lama@peace.org", "invalid.edu", "quant@bigdatacollege.edu", "cookie.monster@sesame.tv") 电子邮件我们可以使用grep grep("@.*\\.edu$", emails, value = TRUE) #[1] "john.doe@iv

我有一个电子邮件列表,如下所示:

emails <- c("john.doe@ivyleague.edu", "education@world.gov", "dalai.lama@peace.org", "invalid.edu", "quant@bigdatacollege.edu", "cookie.monster@sesame.tv")

电子邮件我们可以使用
grep

grep("@.*\\.edu$", emails, value = TRUE)
#[1] "john.doe@ivyleague.edu"   "quant@bigdatacollege.edu"

R提供了执行这些任务的集成方法,例如

在这里,我向您展示一个示例:

# The emails vector
emails <- c("john.doe@ivyleague.edu", "education@world.gov", "dalai.lama@peace.org",
            "invalid.edu", "quant@bigdatacollege.edu", "cookie.monster@sesame.tv")

# Use grepl() to match for .edu addresses more robustly
grepl("@.*\\.edu$", emails)

# Use grep() to match for .edu addresses more robustly, save result to hits
hits <- grep("@.*\\.edu$", emails)

# Subset emails using hits
emails[hits]
#电子邮件向量

电子邮件您也可以使用
stru subset
from
stringr

stringr::str_subset(emails, '@.*\\.edu$')
#[1] "john.doe@ivyleague.edu"   "quant@bigdatacollege.edu"
这类似于
stringi
stri\u subset\u regex

stringi::stri_subset_regex(emails, '@.*\\.edu$')

谢谢它工作得很好,我不知道这个方法我投了你的票,但是一步一步的解决方法对我来说更舒服!它工作得很好,我不知道这个方法你可以使用
endsWith
endsWith(emails,.edu')
stringi::stri_subset_regex(emails, '@.*\\.edu$')