使用stringr[下一行查询]烦扰正则表达式

使用stringr[下一行查询]烦扰正则表达式,r,regex,stringr,R,Regex,Stringr,我已经为此做了很多尝试,现在必须求助于你。我在这里看到过相关的帖子,但没有任何帮助。我很恼火为什么我不能得到一个仪器列表,它似乎出现在单词instruments:后面的一行 library(RCurl);library(XML);library(rvest);library(dplyr);library(stringr) A<-"https://www.google.com/search?q=lester+young&oq=lester+young&aqs=chrome.

我已经为此做了很多尝试,现在必须求助于你。我在这里看到过相关的帖子,但没有任何帮助。我很恼火为什么我不能得到一个仪器列表,它似乎出现在单词
instruments:
后面的一行

library(RCurl);library(XML);library(rvest);library(dplyr);library(stringr)

A<-"https://www.google.com/search?q=lester+young&oq=lester+young&aqs=chrome..69i57j69i60l2j0l3.1767j1j4&sourceid=chrome&ie=UTF-8"

result<-A %>%
    read_html()%>%
    html_nodes(xpath="//span")%>%html_text()

# Parse `result` with regex
instruments<-str_extract(result,"(.*Instruments:\n.*)")
instruments
dob<-str_extract(result,".*(Born: \n.*)")
dob
库(RCurl);图书馆(XML);图书馆(rvest);图书馆(dplyr);图书馆(stringr)
A%
html_节点(xpath=“//span”)%%>%html_文本()
#用正则表达式解析'result'

仪器这对我有用。获取“Instruments:”的索引,然后打印下一个条目。当然,如果页面格式更改,这可能不起作用

> i <- as.integer(grep("Instruments:",result))
> print(result[i+1])
[1] "Tenor saxophone, clarinet"
>我打印(结果[i+1])
[1] 男高音萨克斯管、单簧管
或者这个:

> result_all <- paste(result,collapse="\n")
> str_extract(result_all,"(Instruments:.*\\n.*)")
[1] "Instruments: \nTenor saxophone, clarinet"
>result\u all str\u extract(result\u all,”(仪器:.\\n.*))
[1] 乐器:萨克斯管、单簧管

向我们展示一些示例文本在使用上述代码之前,您肯定已经包含了一些库。请您在代码中添加
语句,以便我们知道要包含什么?我觉得“Instruments”在
\n
之间有一个空格。请尝试
“(.*Instruments:\s+?\n*)”
我得到错误:“\s”是以“(.*Instruments:\s”开头的字符串中无法识别的转义符。需要使用折叠参数。谢谢!