Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/70.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用登录进行Python web抓取_Python_Html_Web_Web Scraping_Request - Fatal编程技术网

使用登录进行Python web抓取

使用登录进行Python web抓取,python,html,web,web-scraping,request,Python,Html,Web,Web Scraping,Request,我试图通过密码保护的网站登录,以便访问受保护的页面,我有电子邮件和密码名称以及csrf-token。但当我尝试访问受保护的页面时,它不允许我,并将我重定向回登录。任何帮助都将非常棒!我试图访问的站点是 试着看看这个,看看你想要的答案。总之,你需要检查网页,在你开始你的完整的抓取程序之前,你应该编写另一个函数,输入用户名、密码,然后进入网站。完成后,开始完整的脚本编写。啊,我明白了。执行后,打印结果.内容返回什么?(我不是该网站的成员,因此我无法继续进行正向测试。它返回登录页面的html,因此我

我试图通过密码保护的网站登录,以便访问受保护的页面,我有电子邮件和密码名称以及csrf-token。但当我尝试访问受保护的页面时,它不允许我,并将我重定向回登录。任何帮助都将非常棒!我试图访问的站点是


试着看看这个,看看你想要的答案。总之,你需要检查网页,在你开始你的完整的抓取程序之前,你应该编写另一个函数,输入用户名、密码,然后进入网站。完成后,开始完整的脚本编写。

啊,我明白了。执行后,
打印结果.内容
返回什么?(我不是该网站的成员,因此我无法继续进行正向测试。它返回登录页面的html,因此我想我会被重定向到该页面。如果你检查帖子数据,你会看到超过3个输入(6)你可能需要所有tem。此外,你可能必须在
标题中包含“用户代理”和“引用者”
import requests
from lxml import html

session_requests = requests.session()

login_url = "https://www.usertesting.com/users/sign_in"
result = session_requests.get(login_url)

tree = html.fromstring(result.text)
authenticity_token = list(set(tree.xpath("//meta[@name='csrf-token']/@content")))[0]

userInfo = {
    "user[email]": "email", 
    "user[password]": "password", 
    "csrf-token": authenticity_token
}

result = session_requests.post(
    login_url, 
    data = userInfo, 
    headers = dict(referer=login_url)
)

url = 'https://www.usertesting.com/my_dashboard'

result = session_requests.get(
    url, 
    headers = dict(referer = url)
)

print result.content