通过splashr使用令牌发布请求
我想从robots.txt中获取一些允许的内容。 由于网站的许多部分都是用javascript加密的,我想用通过splashr使用令牌发布请求,r,web-scraping,v8,rvest,splash-js-render,R,Web Scraping,V8,Rvest,Splash Js Render,我想从robots.txt中获取一些允许的内容。 由于网站的许多部分都是用javascript加密的,我想用splashr或rvest和V8一起使用 Splashr将很容易,因为render_html()基本上完成了这项工作,但我需要先登录 登录站点为每次页面刷新生成一个新令牌。所以我的问题是。在splashr中执行所需POST请求的最简单方法是什么 我已经知道如何访问令牌,但我不知道如何在获取会话时在POST请求中结合该令牌 page <- render_html(url ='https
splashr
或rvest
和V8
一起使用
Splashr将很容易,因为render_html()
基本上完成了这项工作,但我需要先登录
登录站点为每次页面刷新生成一个新令牌。所以我的问题是。在splashr
中执行所需POST请求的最简单方法是什么
我已经知道如何访问令牌,但我不知道如何在获取会话时在POST请求中结合该令牌
page <- render_html(url ='https://www.strava.com/login', wait = 10) %>%
write_html( file = 'test.html')
read_page <- read_lines('test.html')
token <- read_page %>%
str_extract(pattern = '.*authenticity_token.*') %>%
.[is.na(.)==F]
%>% .[2]
%>%
str_match(pattern = '.{88}\\"><div\\sclass=\\"facebook\\">') %>%
gsub(pattern = '\\"><div\\s.*', replacement = '')
page%
编写html(文件='test.html')
阅读页数%
[is.na(.)==F]
%>% .[2]
%>%
str_匹配(模式='.{88}\\\“>')%%
gsub(模式=“\\”>