python3使用xpath从html中提取html部分
我想用python xpath从以下html中提取html的一部分。 我的问题只是想提取html部分,包括标记和文本,而这个问题是提取html的文本部分,所以这两个问题是不同的python3使用xpath从html中提取html部分,html,xpath,python-3.5,Html,Xpath,Python 3.5,我想用python xpath从以下html中提取html的一部分。 我的问题只是想提取html部分,包括标记和文本,而这个问题是提取html的文本部分,所以这两个问题是不同的 <html> <body> <div class ="item"> <ul> <li class="item-0"><a href="link1.html">first item</a></li>
<html>
<body>
<div class ="item">
<ul>
<li class="item-0"><a href="link1.html">first item</a></li>
<li class="item-1"><a href="link2.html">second item</a></li>
<li class="item-inactive"><a href="link3.html">third item</a> </li>
<li class="item-1"><a href="link4.html">fourth item</a></li>
<li class="item-0"><a href="link5.html">fifth item</a></li>
</ul>
</div>
<div class = "movie">
<div title = "name">
<ul>[url=http://]
<li class="item-0"><a href="link1.html">movie a</a></li>
<li class="item-1"><a href="link2.html">movie b</a></li>
<li class="item-inactive"><a href="link3.html">movie c</a></li>
<li class="item-1"><a href="link4.html">movie d</a></li>
</ul>
</div>
</div>
</body>
</html>
但结果是
<Element div at 0x103620e58>
例如,我想获取这部分html中的所有元素
<ul> <li> .
- 。
请使用xpath方法,而不是其他方法
例如,我想获取这部分html中的所有元素
-
尝试使用:
或: 更新:(感谢@Rafaelalmeda)对于所有的元素都会让div崩溃body = tree.xpath('//div[contains(@title, "name")]/ul')
例如,我想获取这部分html中的所有元素body = tree.xpath('//div[contains(@title, "name")]//*')
-
尝试使用:
或: 更新:(感谢@Rafaelalmeda)对于所有的元素都会让div崩溃body = tree.xpath('//div[contains(@title, "name")]/ul')
body = tree.xpath('//div[contains(@title, "name")]//*')
可能的重复可能的重复那不是OP要求的@拉斐拉梅达:嗯,也许你是对的,因为“获取所有元素”Thanks@hr_117还有@Rafael Almeida,我想要的代码是:body=tree.xpath('//div[contains(@title,“name”)]//*)你是个好人,要认真回答。最美好的祝福!此外,如果您有一些关于xpath的资料链接或教程,请告诉我!无论如何,非常感谢!这不是OP要求的@拉斐拉梅达:嗯,也许你是对的,因为“获取所有元素”Thanks@hr_117还有@Rafael Almeida,我想要的代码是:body=tree.xpath('//div[contains(@title,“name”)]//*)你是个好人,要认真回答。最美好的祝福!此外,如果您有一些关于xpath的资料链接或教程,请告诉我!无论如何,非常感谢!
-
尝试使用: