Python 从.asp文件获取数据

Python 从.asp文件获取数据,python,Python,我女朋友的任务是从网页上获取所有数据。该网页属于成人教育中心。要访问该网页,您必须首先登录。url是一个.asp文件 她必须把数据放在Excel表格中。参赛作品包括学生姓名、号码、身份证号码、电话等。参赛作品数以千计。仅人力资源部的学生就有70页的条目。这些都以表格的形式出现在网页上。可以复制和粘贴 我可以合理地处理Python openpyxl,我听说过web抓取,我相信Python可以做到这一点 我不知道.asp是什么 你能给我一些关于如何用Python获取数据的提示吗 我能自动完成这项任务

我女朋友的任务是从网页上获取所有数据。该网页属于成人教育中心。要访问该网页,您必须首先登录。url是一个.asp文件

她必须把数据放在Excel表格中。参赛作品包括学生姓名、号码、身份证号码、电话等。参赛作品数以千计。仅人力资源部的学生就有70页的条目。这些都以表格的形式出现在网页上。可以复制和粘贴

我可以合理地处理Python openpyxl,我听说过web抓取,我相信Python可以做到这一点

我不知道.asp是什么

你能给我一些关于如何用Python获取数据的提示吗

我能自动完成这项任务吗


MySQL就是这样吗?(关于这一点我一无所知。)

这是一个非常广泛的问题,并不是真正意义上的堆栈溢出。给你一些建议。据我所知,最终.asp文件的行为与普通网站类似。普通网站在浏览器中解释,如HTML、CSS等。这可以用Python解析。我在过去的工作中使用了两种方法。一种是使用
requests
这样的库来获取页面的HTML,然后使用
BeautifulSoup
库来读取它。如果需要访问经过身份验证的页面,这会变得更加复杂。另一个选项是对python使用
Selenium
。这个模块更像是一个自动浏览的工具。您可以使用此功能自动访问网站并输入登录凭据,然后阅读页面上的内容。可能有更多的选择,这就是为什么这个问题太广泛的原因。祝你的项目好运


编辑:这不需要MySql。特别是如果所需的输出是Excel文件,我会将其生成为CSV,因为标准Python比Excel更适合CSV文件。

这是一个非常广泛的问题,并不是真正的堆栈溢出样式。给你一些建议。据我所知,最终.asp文件的行为与普通网站类似。普通网站在浏览器中解释,如HTML、CSS等。这可以用Python解析。我在过去的工作中使用了两种方法。一种是使用
requests
这样的库来获取页面的HTML,然后使用
BeautifulSoup
库来读取它。如果需要访问经过身份验证的页面,这会变得更加复杂。另一个选项是对python使用
Selenium
。这个模块更像是一个自动浏览的工具。您可以使用此功能自动访问网站并输入登录凭据,然后阅读页面上的内容。可能有更多的选择,这就是为什么这个问题太广泛的原因。祝你的项目好运


编辑:这不需要MySql。特别是如果所需的输出是Excel文件,我会将其生成为CSV,因为标准Python处理CSV文件的效果比Excel好。

尝试使用名为Octoparse的工具


免责声明:我自己从未使用过它,但只是接近使用它。因此,根据我对其功能的了解,我认为它对您的需要很有用。

尝试使用名为Octoparse的工具

免责声明:我自己从未使用过它,但只是接近使用它。因此,根据我对其特点的了解,我认为它对您的需要是有用的