Python 使用BeautifulSoup从HTML中提取div类文本
试图从OkCupid中提取数据并获取相关文本数据 例如,用户名数据存储在:Python 使用BeautifulSoup从HTML中提取div类文本,python,html,web-scraping,beautifulsoup,Python,Html,Web Scraping,Beautifulsoup,试图从OkCupid中提取数据并获取相关文本数据 例如,用户名数据存储在: <div class="userinfo2015-basics-username"> AmericanMary666 它不起作用,我也不知道为什么 在您提供的链接中没有带有classuserinfo2015 basics username的div。 我猜您是从当前登录的浏览器中查看HTML源代码。尝试注销或匿名会话,您将看到不同的来源。 您可能希望查看requests模块,以验证和维护请求之间的会话 fr
<div class="userinfo2015-basics-username"> AmericanMary666
它不起作用,我也不知道为什么 在您提供的链接中没有带有class
userinfo2015 basics username
的div
。
我猜您是从当前登录的浏览器中查看HTML源代码。尝试注销或匿名会话,您将看到不同的来源。
您可能希望查看requests模块,以验证和维护请求之间的会话
from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://www.okcupid.com/profile/AmericanMary666")
bsObj = BeautifulSoup(html,"html.parser")
nameList = bsObj.findAll('div', attrs={'class': 'userinfo2015-basics-username'})
for name in nameList:
print(name.get_text())