Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/72.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何从R字符串中提取某些单词?_R_Stringr - Fatal编程技术网

如何从R字符串中提取某些单词?

如何从R字符串中提取某些单词?,r,stringr,R,Stringr,我对解析数据比较陌生 我有一个数据集,其中包含以下紧跟此格式的示例文本数据: "Blessed to receive an offer from Texas State University." "Blessed to receive an offer from Columbia University." 在“from”之后提取学校名称的好方法是什么 我知道stringr和pattern,但似乎找不到一种方法来正确提取学校名称的变化 使用stru extract(并假设所有uni名称后面紧跟

我对解析数据比较陌生

我有一个数据集,其中包含以下紧跟此格式的示例文本数据:

"Blessed to receive an offer from Texas State University." 
"Blessed to receive an offer from Columbia University."
在“from”之后提取学校名称的好方法是什么


我知道stringr和pattern,但似乎找不到一种方法来正确提取学校名称的变化

使用
stru extract
(并假设所有uni名称后面紧跟一个句点):


你试过哪些不起作用?这似乎是一个很好的起点:@camille我试过使用str_split_fixed(df$text,“from”,3)和str_split(df$text,“from”),那些不起作用的呢?这有助于深入了解你的问题,如果问题后面没有句号,那么最好的做法是什么?这将彻底改变情况。然后,这可能会有所帮助:
为后代提供数据,您还可以执行
stru匹配(数据,“from\\s([A-Za-z\\s]+)”)
@rpolicastro您建议的正则表达式的结果不完全是所需的匹配:
stru匹配(数据,“from\\s([A-Za-z\\s]+)”[,1][,2][1,]“来自德克萨斯州立大学”“德克萨斯州立大学”[2,]“来自哥伦比亚大学”“哥伦比亚大学”[3,]“来自哥伦比亚大学和其他大学”“哥伦比亚大学和其他大学”
我在回复原来的帖子。我不知道他想要的比赛不会以周期结束。
data <- c("Blessed to receive an offer from Texas State University.", 
          "Blessed to receive an offer from Columbia University.")
UniNames <- str_extract(data, "(?<=from\\s).*(?=\\.)")
UniNames
[1] "Texas State University" "Columbia University"