python中的爬虫程序

python中的爬虫程序,python,Python,我有一个网站(我的大学网站),每个学生都有一个用户名/密码登录到他的帐户。该网站由许多以不同格式上传的文件组成。我想以编程方式输入我的凭据并登录到我的帐户,然后下载网站中上载的所有文件 是否有任何python模块可以对html表单进行身份验证并提供对页面的访问,然后允许下载这些页面中的文件?我想看看。它是基于python的爬虫/刮板,您可以自定义它来执行任何您想要的工作流。下面是一个如何处理用户身份验证的示例:Yes。有。你有更具体的问题吗?我想做的就是下载网站中存在的文件,这些文件只能通过提供

我有一个网站(我的大学网站),每个学生都有一个用户名/密码登录到他的帐户。该网站由许多以不同格式上传的文件组成。我想以编程方式输入我的凭据并登录到我的帐户,然后下载网站中上载的所有文件


是否有任何python模块可以对html表单进行身份验证并提供对页面的访问,然后允许下载这些页面中的文件?

我想看看。它是基于python的爬虫/刮板,您可以自定义它来执行任何您想要的工作流。下面是一个如何处理用户身份验证的示例:

Yes。有。你有更具体的问题吗?我想做的就是下载网站中存在的文件,这些文件只能通过提供凭据来访问。好的。是否有任何python模块可以验证html表单并提供对页面的访问,然后允许下载这些页面中存在的文件?“是否有任何python模块…”对答案几乎总是“是”。你应该——也许——问你真正的问题。仅仅测试是否存在并不能提供很好的信息。也许你想知道哪个模块?或者,您可能希望在堆栈溢出中搜索与您的问题相同的现有问题。例如,所有这些可能已经回答了您的问题: