登录到httr moviepilot中的页面

登录到httr moviepilot中的页面,r,authentication,web-scraping,httr,R,Authentication,Web Scraping,Httr,我正试着让自己开始抓取网页。现在我的目标是从页面上获取我的个人分级电影 为此,我需要访问以下页面:。但如果没有身份验证,这是不可能的 我已经读到httr包可以做类似的事情,使用handle将其保存为处理程序,然后使用您的登录信息浏览主页。从而访问所需的页面。应该是这样的: library(httr) mp = handle("http://moviepilot.de") # authentication step GET(handle=mp, path="/users/schlusie/rate

我正试着让自己开始抓取网页。现在我的目标是从页面上获取我的个人分级电影

为此,我需要访问以下页面:。但如果没有身份验证,这是不可能的

我已经读到
httr
包可以做类似的事情,使用
handle
将其保存为处理程序,然后使用您的登录信息浏览主页。从而访问所需的页面。应该是这样的:

library(httr)
mp = handle("http://moviepilot.de")
# authentication step
GET(handle=mp, path="/users/schlusie/rated/movies")
这是登录页面:


有人能给我一些建议吗?

从技术上讲,这不是一个重复的----因为您使用的是
httr
,而不是直接使用
RCurl
httr
几乎是一个
RCurl
包装器)。看看那篇SO帖子,看看你是否可以根据自己的需要对它进行改装。使用
httr
,你不需要做任何事情就可以在请求之间保留cookie,默认情况下它会这样做。要确定登录时需要发送什么请求,您需要检查html或使用浏览器调试功能。谢谢。我是这方面的新手。你知道一些教程或帮助者如何检查我应该发布什么来访问页面吗?我建议在网络下使用开发者工具(例如在Google Chrome>View>Developer>Developer tools),你可以观察发送的请求。你的项目进展顺利吗?我也在尝试类似的任务。