Django 如何使用BeautifulSoup获取url的名称_Django_Web Scraping_Beautifulsoup_Urllib2

Django 如何使用BeautifulSoup获取url的名称

django web-scraping

Django 如何使用BeautifulSoup获取url的名称,django,web-scraping,beautifulsoup,urllib2,Django,Web Scraping,Beautifulsoup,Urllib2,如何使用BeautifulSoup获取url的名称。我有以下代码： from BeautifulSoup import BeautifulSoup import urllib2 import re html_page = urllib2.urlopen("http://www.youtube.com") soup = BeautifulSoup(html_page) list = soup.findAll('div', attrs={'class':'profileBox'}) for

如何使用BeautifulSoup获取url的名称。我有以下代码：

from BeautifulSoup import BeautifulSoup
import urllib2
import re

html_page = urllib2.urlopen("http://www.youtube.com")
soup = BeautifulSoup(html_page)
list =  soup.findAll('div', attrs={'class':'profileBox'})

for div in list:
    print div.a['href']

---------------------------------
<a href="/sam">sam utx</a>
-------------------------------------

从美化组导入美化组
导入urllib2
进口稀土
html_page=urllib2.urlopen（“http://www.youtube.com")
soup=BeautifulSoup（html_页面）
list=soup.findAll（'div'，attrs={'class'：'profileBox'}）
对于列表中的div：
打印分区a['href']
---------------------------------
-------------------------------------

这将打印href（“/sam”），但我需要的是url的名称（sam utx）。

我如何做到这一点？

您可以使用以下命令选择

div

内部的

文本

：

div.a.string

你可以阅读更多关于这方面的内容