Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/91.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使用Beautifulsoup提取文本_Python_Html_Beautifulsoup_Html Parsing - Fatal编程技术网

Python 如何使用Beautifulsoup提取文本

Python 如何使用Beautifulsoup提取文本,python,html,beautifulsoup,html-parsing,Python,Html,Beautifulsoup,Html Parsing,在这种情况下,您能告诉我如何使用BeautifulSoup提取标题文本(Inna)吗: <div class="wallpapers-box-300x180-2 wallpapers-margin-2"> <div class="wallpapers-box-300x180-2-img"><a title="Inna" href="/photo.jpg" alt="Inna" width="300" height="188" /></a></

在这种情况下,您能告诉我如何使用BeautifulSoup提取标题文本(Inna)吗:

<div class="wallpapers-box-300x180-2 wallpapers-margin-2">
<div class="wallpapers-box-300x180-2-img"><a title="Inna" href="/photo.jpg" alt="Inna" width="300" height="188" /></a></div>
<div class="wallpapers-box-300x180-2-title"><a title="Inna" href="/wallpapers/inna/">Inna</a></div>


谢谢。

在这种情况下,有很多方法可以找到元素,很难判断哪种方法更适合您,因为我们不知道问题的范围、元素的独特性以及您知道和可以依赖什么

我认为最实际的方法是使用以下方法:


在这里,我们检查父
div
元素的类以
wallpaps框开始,并在
href
属性值中找到直接
a
具有
wallpaps
文本的子元素

谢谢,我刚刚更新了我的问题,他们更多的课程是从墙纸开始的-box@user1034127解决方案仍然有效。它可能更短:对于汤中的榆树。选择('a[href=“/wallps/inna/”):@mmachine很好,但不太通用-不确定
inna
是否是给定的。
for elm in soup.select('div[class^="wallpapers-box"] > a[href*=wallpapers]'):
    print(elm.get_text())