使用stringr[下一行查询]烦扰正则表达式_R_Regex_Stringr

使用stringr[下一行查询]烦扰正则表达式

r regex

使用stringr[下一行查询]烦扰正则表达式,r,regex,stringr,R,Regex,Stringr,我已经为此做了很多尝试，现在必须求助于你。我在这里看到过相关的帖子，但没有任何帮助。我很恼火为什么我不能得到一个仪器列表，它似乎出现在单词instruments:后面的一行 library(RCurl);library(XML);library(rvest);library(dplyr);library(stringr) A<-"https://www.google.com/search?q=lester+young&oq=lester+young&aqs=chrome.

我已经为此做了很多尝试，现在必须求助于你。我在这里看到过相关的帖子，但没有任何帮助。我很恼火为什么我不能得到一个仪器列表，它似乎出现在单词

instruments:

后面的一行

library(RCurl);library(XML);library(rvest);library(dplyr);library(stringr)

A<-"https://www.google.com/search?q=lester+young&oq=lester+young&aqs=chrome..69i57j69i60l2j0l3.1767j1j4&sourceid=chrome&ie=UTF-8"

result<-A %>%
    read_html()%>%
    html_nodes(xpath="//span")%>%html_text()

# Parse `result` with regex
instruments<-str_extract(result,"(.*Instruments:\n.*)")
instruments
dob<-str_extract(result,".*(Born: \n.*)")
dob

库（RCurl）；图书馆（XML）；图书馆（rvest）；图书馆（dplyr）；图书馆（stringr）
A%
html_节点（xpath=“//span”）%%>%html_文本（）
#用正则表达式解析'result'
仪器这对我有用。获取“Instruments:”的索引，然后打印下一个条目。当然，如果页面格式更改，这可能不起作用
> i <- as.integer(grep("Instruments:",result))
> print(result[i+1])
[1] "Tenor saxophone, clarinet"

>我打印（结果[i+1]）
[1] 男高音萨克斯管、单簧管

或者这个：
> result_all <- paste(result,collapse="\n")
> str_extract(result_all,"(Instruments:.*\\n.*)")
[1] "Instruments: \nTenor saxophone, clarinet"

>result\u all str\u extract（result\u all，”（仪器：.\\n.*））
[1] 乐器：萨克斯管、单簧管
向我们展示一些示例文本在使用上述代码之前，您肯定已经包含了一些库。请您在代码中添加库
语句，以便我们知道要包含什么？我觉得“Instruments”在：
和\n
之间有一个空格。请尝试“（.*Instruments:\s+？\n*）”
我得到错误：“\s”是以“（.*Instruments:\s”开头的字符串中无法识别的转义符。需要使用折叠参数。谢谢！