使用Python阅读网页搜索结果_Python_Html_Urllib

使用Python阅读网页搜索结果

python html

使用Python阅读网页搜索结果,python,html,urllib,Python,Html,Urllib,我希望能够为web搜索的某些匹配类型生成自动警报。第一步是用Python读取url，这样我就可以使用BeautifulSoup或其他基于正则表达式的方法对其进行解析。但是，对于下面示例中的页面，当我使用浏览器打开页面时，html不会捕获我正在可视化的结果。有没有一种方法可以通过搜索结果自己获取HTML import urllib link = 'http://www.sas.com/jobs/USjobs/search.html' f = urllib.urlopen(link) myfi

我希望能够为web搜索的某些匹配类型生成自动警报。第一步是用Python读取url，这样我就可以使用BeautifulSoup或其他基于正则表达式的方法对其进行解析。但是，对于下面示例中的页面，当我使用浏览器打开页面时，html不会捕获我正在可视化的结果。有没有一种方法可以通过搜索结果自己获取HTML

import urllib

link = 'http://www.sas.com/jobs/USjobs/search.html'
f = urllib.urlopen(link)
myfile = f.read()
print myfile

您无法通过使用传统的urllib、urllib2或请求模块（甚至无法机械化）来获取使用javascript动态生成的数据。您必须通过将selenium与chrome、Firefox或phantomjs结合使用来模拟浏览器环境，以评估网页中的javascript

看看

您无法通过使用传统的urllib、urllib2或请求模块（甚至是机械化）来获取使用javascript动态生成的数据。您必须通过将selenium与chrome、Firefox或phantomjs结合使用来模拟浏览器环境，以评估网页中的javascript

看看

查看一下

您不能单独使用urllib来查看动态呈现在客户端（JavaScript）上的代码。原因是urllib只从服务器获取响应，即头和主体（实际代码）。因此，我不会执行客户端代码。您需要使用Selenium—一个浏览器自动化模块—您不能单独使用urllib来查看动态呈现的客户端（JavaScript）代码。原因是urllib只从服务器获取响应，即头和主体（实际代码）。因此，我不会执行客户端代码。您需要使用Selenium—一个浏览器自动化模块—您不能单独使用urllib来查看动态呈现的客户端（JavaScript）代码。原因是urllib只从服务器获取响应，即头和主体（实际代码）。因此，我不会执行客户端代码。您需要使用Selenium—一个浏览器自动化模块—您不能单独使用urllib来查看动态呈现的客户端（JavaScript）代码。原因是urllib只从服务器获取响应，即头和主体（实际代码）。因此，我不会执行客户端代码。您需要使用Selenium—一个浏览器自动化模块