重定向URL时的R刮取(302)
与R相关的问题,我对R很陌生 我正在电影数据库上运行刮板,但至少有一个URL被重定向到另一个页面 你知道我怎样才能跟踪URL并刮取重定向的站点吗 我一直在使用这种方法获取XML重定向URL时的R刮取(302),r,redirect,rcurl,scraper,R,Redirect,Rcurl,Scraper,与R相关的问题,我对R很陌生 我正在电影数据库上运行刮板,但至少有一个URL被重定向到另一个页面 你知道我怎样才能跟踪URL并刮取重定向的站点吗 我一直在使用这种方法获取XML require(XML) require(RCurl) fixedURL <- getURL("https://www.themoviedb.org/movie/260346-taken-3/cast") parsed.html <- htmlParse(fixedURL) require(XML) 需
require(XML)
require(RCurl)
fixedURL <- getURL("https://www.themoviedb.org/movie/260346-taken-3/cast")
parsed.html <- htmlParse(fixedURL)
require(XML)
需要(RCurl)
fixedURLrvest包似乎落在正确的页面上
library("rvest")
url <- "https://www.themoviedb.org/movie/260346-taken-3/cast"
# get movie title
url %>%
html() %>%
html_nodes("#mainCol :nth-child(1) :nth-child(1) :nth-child(1) :nth-child(1)") %>%
html_text()
[1] "Taken 3"
library(“rvest”)
url%
html()%>%
html#u节点(#mainCol:n个子节点(1):n个子节点(1):n个子节点(1):n个子节点(1)”)%>%
html_text()
[1] “拍摄3”
非常好(竖起两个大拇指)。很好用,现在就去读维斯特,从没看过。非常感谢。将followlocation=TRUE
添加到getURL()
。我实现此方法比使用rvest更快。谢谢你,马丁