Python 正确的库用法:请求w/bs4.BeautifulSoup?
我刚从使用Python 正确的库用法:请求w/bs4.BeautifulSoup?,python,tags,request,beautifulsoup,urllib2,Python,Tags,Request,Beautifulsoup,Urllib2,我刚从使用urllib2作为HTTP访问库切换到使用request库。在urllib中,您使用BeautifulSoup来使用findAll(tag='element')函数提取html元素,我是否继续以相同的方式使用BeautifulSoup,或者请求是否具有简化此过程的函数 使用urllib2拉取标记 使用请求提取标签 只会使从URL获取数据变得更容易,尤其是在存在重定向等情况下。它不会解析HTML的主体,您仍然应该使用BeautifulSoup来完成此操作,并将导入添加到第二个代码
urllib2
作为HTTP访问库切换到使用request
库。在urllib中,您使用BeautifulSoup
来使用findAll(tag='element')
函数提取html元素,我是否继续以相同的方式使用BeautifulSoup,或者请求是否具有简化此过程的函数
使用urllib2拉取标记
使用请求提取标签
只会使从URL获取数据变得更容易,尤其是在存在重定向等情况下。它不会解析
HTML
的主体,您仍然应该使用BeautifulSoup
来完成此操作,并将导入添加到第二个代码片段中,类似于:
soup = BS(response.text)
import response
response = request.get('http://stackoverflow.com/')
for a in response.findAll('a'):
print a['href]
soup = BS(response.text)