用于解析HTML的Python和BeautifulSoup_Python_Beautifulsoup

用于解析HTML的Python和BeautifulSoup

python

用于解析HTML的Python和BeautifulSoup,python,beautifulsoup,Python,Beautifulsoup,我已经有了HTML，但我只想从中提取一个字符串每个HTML文件中都有一行如下所示 <h4 class="ws-ds-name detail-title">DATA_I_WANT</h4> 我想要的数据我不知道如何使用.find（）方法精确地获取该标记，然后提取出我想要的数据有什么建议吗谢谢或者您可以使用lxml： from lxml.html import fromstring doc = fromstring(markup) doc.xpath('//h

我已经有了HTML，但我只想从中提取一个字符串

每个HTML文件中都有一行如下所示

<h4 class="ws-ds-name detail-title">DATA_I_WANT</h4>

我想要的数据

我不知道如何使用.find（）方法精确地获取该标记，然后提取出我想要的数据

有什么建议吗

谢谢

或者您可以使用lxml：

from lxml.html import fromstring
doc = fromstring(markup)
doc.xpath('//h4[@class="ws-ds-name detail-title"]')[0].text
# result: 
# 'DATA_I_WANT'

我得到以下错误：AttributeError:“非类型”对象没有属性“内容”。最初的发现返回了一个NoneType，但我很确定这行看起来是这样的。有什么想法吗？对不起，它似乎在我的机器上工作（使用BS和lxml）。也许其他人会知道问题出在哪里。祝你好运。@Arjun:亚当的密码看起来不错。请向我们显示导致AttributeError的HTML标记。

from lxml.html import fromstring
doc = fromstring(markup)
doc.xpath('//h4[@class="ws-ds-name detail-title"]')[0].text
# result: 
# 'DATA_I_WANT'