Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/288.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
我需要学习什么python库才能浏览这个网站?_Python_Web Scraping - Fatal编程技术网

我需要学习什么python库才能浏览这个网站?

我需要学习什么python库才能浏览这个网站?,python,web-scraping,Python,Web Scraping,我想从以下网站下载所有的周日纵横字谜 我可以手动搜索“星期天纵横字谜”并获得我需要的所有结果。但是结果都会在javascript弹出窗口中打开 我需要学习/使用什么python库来处理此类问题 我知道urllib的基本原理。这能用于这个特殊目的吗 我是一个相对较新的程序员,不太了解网络技术。因此,任何关于阅读哪些资源的建议都会很有帮助。Selenium将是一个很好的工具。因为它驱动一个真正的浏览器,所以它可以处理JavaScript弹出窗口 以下是文档的链接: 还有一些视频教程: JS弹出窗

我想从以下网站下载所有的周日纵横字谜

我可以手动搜索“星期天纵横字谜”并获得我需要的所有结果。但是结果都会在javascript弹出窗口中打开

我需要学习/使用什么python库来处理此类问题

我知道urllib的基本原理。这能用于这个特殊目的吗


我是一个相对较新的程序员,不太了解网络技术。因此,任何关于阅读哪些资源的建议都会很有帮助。

Selenium将是一个很好的工具。因为它驱动一个真正的浏览器,所以它可以处理JavaScript弹出窗口

以下是文档的链接:

还有一些视频教程:


JS弹出窗口不会在网站上打开,可能需要进行身份验证吗?我很想看看您在这一个上得到了什么答案。对于使用html内容的简单网络爬虫/刮板,我这里有一些代码:。但是,我认为这对javascript弹出窗口不起作用。@alecxe不需要身份验证。这是印度日报《印度时报》电子版的档案页。因此,我假设,我有权刮它。但是,访问内容不需要身份验证。Selenium不处理javascript吗?不久前,这里有一个类似于javascript web爬行的问题。