Python 使用BeautifulSoup从HTML中提取div类文本_Python_Html_Web Scraping_Beautifulsoup

Python 使用BeautifulSoup从HTML中提取div类文本

python html web-scraping

Python 使用BeautifulSoup从HTML中提取div类文本,python,html,web-scraping,beautifulsoup,Python,Html,Web Scraping,Beautifulsoup,试图从OkCupid中提取数据并获取相关文本数据例如，用户名数据存储在： <div class="userinfo2015-basics-username"> AmericanMary666 它不起作用，我也不知道为什么在您提供的链接中没有带有classuserinfo2015 basics username的div。我猜您是从当前登录的浏览器中查看HTML源代码。尝试注销或匿名会话，您将看到不同的来源。您可能希望查看requests模块，以验证和维护请求之间的会话 fr

试图从OkCupid中提取数据并获取相关文本数据

例如，用户名数据存储在：

<div class="userinfo2015-basics-username"> AmericanMary666

它不起作用，我也不知道为什么

在您提供的链接中没有带有class

userinfo2015 basics username

的

div

。我猜您是从当前登录的浏览器中查看HTML源代码。尝试注销或匿名会话，您将看到不同的来源。您可能希望查看requests模块，以验证和维护请求之间的会话

from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://www.okcupid.com/profile/AmericanMary666") 

bsObj = BeautifulSoup(html,"html.parser")
nameList = bsObj.findAll('div', attrs={'class': 'userinfo2015-basics-username'})

for name in nameList:
    print(name.get_text())