Django 如何使用BeautifulSoup获取url的名称

Django 如何使用BeautifulSoup获取url的名称,django,web-scraping,beautifulsoup,urllib2,Django,Web Scraping,Beautifulsoup,Urllib2,如何使用BeautifulSoup获取url的名称。 我有以下代码: from BeautifulSoup import BeautifulSoup import urllib2 import re html_page = urllib2.urlopen("http://www.youtube.com") soup = BeautifulSoup(html_page) list = soup.findAll('div', attrs={'class':'profileBox'}) for

如何使用BeautifulSoup获取url的名称。 我有以下代码:

from BeautifulSoup import BeautifulSoup
import urllib2
import re

html_page = urllib2.urlopen("http://www.youtube.com")
soup = BeautifulSoup(html_page)
list =  soup.findAll('div', attrs={'class':'profileBox'})

for div in list:
    print div.a['href']

---------------------------------
<a href="/sam">sam utx</a>
-------------------------------------
从美化组导入美化组
导入urllib2
进口稀土
html_page=urllib2.urlopen(“http://www.youtube.com")
soup=BeautifulSoup(html_页面)
list=soup.findAll('div',attrs={'class':'profileBox'})
对于列表中的div:
打印分区a['href']
---------------------------------
-------------------------------------
这将打印href(“/sam”),但我需要的是url的名称(sam utx)。
我如何做到这一点?

您可以使用以下命令选择
div
内部的
文本

div.a.string
你可以阅读更多关于这方面的内容