重定向URL时的R刮取(302)

重定向URL时的R刮取(302),r,redirect,rcurl,scraper,R,Redirect,Rcurl,Scraper,与R相关的问题,我对R很陌生 我正在电影数据库上运行刮板,但至少有一个URL被重定向到另一个页面 你知道我怎样才能跟踪URL并刮取重定向的站点吗 我一直在使用这种方法获取XML require(XML) require(RCurl) fixedURL <- getURL("https://www.themoviedb.org/movie/260346-taken-3/cast") parsed.html <- htmlParse(fixedURL) require(XML) 需

与R相关的问题,我对R很陌生

我正在电影数据库上运行刮板,但至少有一个URL被重定向到另一个页面

你知道我怎样才能跟踪URL并刮取重定向的站点吗

我一直在使用这种方法获取XML

require(XML) 
require(RCurl) 
fixedURL <- getURL("https://www.themoviedb.org/movie/260346-taken-3/cast")
parsed.html <- htmlParse(fixedURL)
require(XML)
需要(RCurl)

fixedURLrvest包似乎落在正确的页面上

library("rvest")
url <- "https://www.themoviedb.org/movie/260346-taken-3/cast"
# get movie title
url %>% 
  html() %>% 
  html_nodes("#mainCol :nth-child(1) :nth-child(1) :nth-child(1) :nth-child(1)") %>%
  html_text()

[1] "Taken 3"
library(“rvest”)
url%
html()%>%
html#u节点(#mainCol:n个子节点(1):n个子节点(1):n个子节点(1):n个子节点(1)”)%>%
html_text()
[1] “拍摄3”

非常好(竖起两个大拇指)。很好用,现在就去读维斯特,从没看过。非常感谢。将
followlocation=TRUE
添加到
getURL()
。我实现此方法比使用rvest更快。谢谢你,马丁