Python 如何抓取需要登录并填写验证码的网站数据

Python 如何抓取需要登录并填写验证码的网站数据,python,web-scraping,Python,Web Scraping,我正在尝试创建一个数据刮板来自动从表中读取数据。但是,我需要登录才能这样做 该网页有用户名和密码的输入字段以及类似的验证码 这是到目前为止我的代码 import requests s = requests.Session() data = {'loginName': 'username', 'password': 'password', } url = 'https://url/api/account/login' response = s.post(ur

我正在尝试创建一个数据刮板来自动从表中读取数据。但是,我需要登录才能这样做

该网页有用户名和密码的输入字段以及类似的验证码

这是到目前为止我的代码

import requests

s = requests.Session()

data = {'loginName': 'username',
        'password': 'password',
        }

url = 'https://url/api/account/login'
response = s.post(url, data=data)

print(response)
s = requests.Session()
然后我打算用美味的汤

现在我的回答是。
我想我需要在数据中包含captchaCode和captchaId,但我不确定如何使用。我也不知道是否需要添加任何标题。

要完成验证码,您需要使用一些第三方服务来完成,或者使用Selenium之类的工具自己填写。
一种选择是尝试登录到该页面,并使用浏览器工具查看该页面是否从某个公共API获取信息,如果是,则您可以将其删除。

。正如您所说,我通过查看api获得了数据。我现在将尝试创建验证码解算器。有什么建议吗?最简单的方法是使用反验证码之类的服务来解决问题,尽管通常需要付费。如果你想解决实际的图像,那么你需要研究OCR(光学字符识别),然而这是更先进的,记住CAPCHA被设计成很难用计算机解决。