Python html中图像标记的检测

Python html中图像标记的检测,python,html,beautifulsoup,Python,Html,Beautifulsoup,我正在使用BeautifulSoup解析页面的HTML。由于损坏的html,标记不一致。我有以下html: <div id='VideoID'> <a href=#><img src='file.png'></a> </div> 但对于第二个,这是显而易见的 我是否在id“VideoID”的DIV中检测到图像标记,无论它是否包含在锚定标记中。是,带有。后代 迭代子体列表并检查.name 使用CSS选择器甚至更容易: soup.se

我正在使用BeautifulSoup解析页面的HTML。由于损坏的html,标记不一致。我有以下html:

<div id='VideoID'>
<a href=#><img src='file.png'></a>
</div>
但对于第二个,这是显而易见的


我是否在id“VideoID”的DIV中检测到图像标记,无论它是否包含在锚定标记中。

是,带有
。后代


迭代子体列表并检查
.name

使用CSS选择器甚至更容易:

soup.select("div#VideoID img")

是,带有
。子体


迭代子体列表并检查
.name

使用CSS选择器甚至更容易:

soup.select("div#VideoID img")

是,带有
。子体


迭代子体列表并检查
.name

使用CSS选择器甚至更容易:

soup.select("div#VideoID img")

是,带有
。子体


迭代子体列表并检查
.name

使用CSS选择器甚至更容易:

soup.select("div#VideoID img")

您可以使用
recursiveChildGenerator()
生成第n个子元素,并可以找到图像标记

例如:

for child in childs.recursiveChildGenerator():
   image_file = child.findChildren("img")

这将帮助您在任何层次结构中查找图像标记。

您可以使用
recursiveChildGenerator()
生成第n个子元素,并可以查找图像标记

例如:

for child in childs.recursiveChildGenerator():
   image_file = child.findChildren("img")

这将帮助您在任何层次结构中查找图像标记。

您可以使用
recursiveChildGenerator()
生成第n个子元素,并可以查找图像标记

例如:

for child in childs.recursiveChildGenerator():
   image_file = child.findChildren("img")

这将帮助您在任何层次结构中查找图像标记。

您可以使用
recursiveChildGenerator()
生成第n个子元素,并可以查找图像标记

例如:

for child in childs.recursiveChildGenerator():
   image_file = child.findChildren("img")

这将帮助您在任何层次结构中查找图像标记。

如您所见。
在我的回答中,子体
是由
.recursiveChildGenerator()
组成的属性。那么有什么区别呢?正如您在我的回答中看到的那样,
.subjections
是由
.recursiveChildGenerator()
组成的属性。那么有什么区别呢?正如您在我的回答中看到的那样,
.subjections
是由
.recursiveChildGenerator()
组成的属性。那么有什么区别呢?正如您在我的回答中看到的那样,
.subjections
是由
.recursiveChildGenerator()
组成的属性。那么区别是什么呢?是的,CSS选择器正变得非常强大——使用它们遍历DOM树非常直观。不用循环和一步一步地做事情,只需一条清晰的线就能解决问题。是的,CSS选择器变得非常强大——使用它们遍历DOM树非常直观。不用循环和一步一步地做事情,只需一条清晰的线就能解决问题。是的,CSS选择器变得非常强大——使用它们遍历DOM树非常直观。不用循环和一步一步地做事情,只需一条清晰的线就能解决问题。是的,CSS选择器变得非常强大——使用它们遍历DOM树非常直观。与循环和一步一步地做事情不同,只有一条清晰的线可以解决问题。