Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/310.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用于解析HTML的Python和BeautifulSoup_Python_Beautifulsoup - Fatal编程技术网

用于解析HTML的Python和BeautifulSoup

用于解析HTML的Python和BeautifulSoup,python,beautifulsoup,Python,Beautifulsoup,我已经有了HTML,但我只想从中提取一个字符串 每个HTML文件中都有一行如下所示 <h4 class="ws-ds-name detail-title">DATA_I_WANT</h4> 我想要的数据 我不知道如何使用.find()方法精确地获取该标记,然后提取出我想要的数据 有什么建议吗 谢谢 或者您可以使用lxml: from lxml.html import fromstring doc = fromstring(markup) doc.xpath('//h

我已经有了HTML,但我只想从中提取一个字符串

每个HTML文件中都有一行如下所示

<h4 class="ws-ds-name detail-title">DATA_I_WANT</h4> 
我想要的数据
我不知道如何使用.find()方法精确地获取该标记,然后提取出我想要的数据

有什么建议吗

谢谢

或者您可以使用lxml:

from lxml.html import fromstring
doc = fromstring(markup)
doc.xpath('//h4[@class="ws-ds-name detail-title"]')[0].text
# result: 
# 'DATA_I_WANT'

我得到以下错误:AttributeError:“非类型”对象没有属性“内容”。最初的发现返回了一个NoneType,但我很确定这行看起来是这样的。有什么想法吗?对不起,它似乎在我的机器上工作(使用BS和lxml)。也许其他人会知道问题出在哪里。祝你好运。@Arjun:亚当的密码看起来不错。请向我们显示导致AttributeError的HTML标记。
from lxml.html import fromstring
doc = fromstring(markup)
doc.xpath('//h4[@class="ws-ds-name detail-title"]')[0].text
# result: 
# 'DATA_I_WANT'