Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/webpack/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用BeautifulSoup从HTML中提取div类文本_Python_Html_Web Scraping_Beautifulsoup - Fatal编程技术网

Python 使用BeautifulSoup从HTML中提取div类文本

Python 使用BeautifulSoup从HTML中提取div类文本,python,html,web-scraping,beautifulsoup,Python,Html,Web Scraping,Beautifulsoup,试图从OkCupid中提取数据并获取相关文本数据 例如,用户名数据存储在: <div class="userinfo2015-basics-username"> AmericanMary666 它不起作用,我也不知道为什么 在您提供的链接中没有带有classuserinfo2015 basics username的div。 我猜您是从当前登录的浏览器中查看HTML源代码。尝试注销或匿名会话,您将看到不同的来源。 您可能希望查看requests模块,以验证和维护请求之间的会话 fr

试图从OkCupid中提取数据并获取相关文本数据

例如,用户名数据存储在:

<div class="userinfo2015-basics-username"> AmericanMary666 

它不起作用,我也不知道为什么

在您提供的链接中没有带有class
userinfo2015 basics username
div
。 我猜您是从当前登录的浏览器中查看HTML源代码。尝试注销或匿名会话,您将看到不同的来源。 您可能希望查看requests模块,以验证和维护请求之间的会话

from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://www.okcupid.com/profile/AmericanMary666") 

bsObj = BeautifulSoup(html,"html.parser")
nameList = bsObj.findAll('div', attrs={'class': 'userinfo2015-basics-username'})

for name in nameList:
    print(name.get_text())