Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/87.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
python3使用xpath从html中提取html部分_Html_Xpath_Python 3.5 - Fatal编程技术网

python3使用xpath从html中提取html部分

python3使用xpath从html中提取html部分,html,xpath,python-3.5,Html,Xpath,Python 3.5,我想用python xpath从以下html中提取html的一部分。 我的问题只是想提取html部分,包括标记和文本,而这个问题是提取html的文本部分,所以这两个问题是不同的 <html> <body> <div class ="item"> <ul> <li class="item-0"><a href="link1.html">first item</a></li>

我想用python xpath从以下html中提取html的一部分。 我的问题只是想提取html部分,包括标记和文本,而这个问题是提取html的文本部分,所以这两个问题是不同的

 <html>
 <body> 
 <div class ="item">
  <ul>
     <li class="item-0"><a href="link1.html">first item</a></li>
     <li class="item-1"><a href="link2.html">second item</a></li>
     <li class="item-inactive"><a href="link3.html">third item</a> </li>
     <li class="item-1"><a href="link4.html">fourth item</a></li>
     <li class="item-0"><a href="link5.html">fifth item</a></li>
  </ul>
  </div>
  <div  class = "movie">
  <div  title = "name">
  <ul>[url=http://]
     <li class="item-0"><a href="link1.html">movie a</a></li>
     <li class="item-1"><a href="link2.html">movie b</a></li>
     <li class="item-inactive"><a href="link3.html">movie c</a></li>
     <li class="item-1"><a href="link4.html">movie d</a></li>
  </ul>
  </div>
  </div>
  </body>
  </html>
但结果是

   <Element div at 0x103620e58>

例如,我想获取这部分html中的所有元素

   <ul> <li> .
请使用xpath方法,而不是其他方法

例如,我想获取这部分html中的所有元素
  • 尝试使用:

      body = tree.xpath('//div[contains(@title, "name")]/ul')
    
    或:

    更新:(感谢@Rafaelalmeda)对于所有的元素都会让div崩溃

      body = tree.xpath('//div[contains(@title, "name")]//*')
    
    例如,我想获取这部分html中的所有元素
    • 尝试使用:

        body = tree.xpath('//div[contains(@title, "name")]/ul')
      
      或:

      更新:(感谢@Rafaelalmeda)对于所有的元素都会让div崩溃

        body = tree.xpath('//div[contains(@title, "name")]//*')
      

      可能的重复可能的重复那不是OP要求的@拉斐拉梅达:嗯,也许你是对的,因为“获取所有元素”Thanks@hr_117还有@Rafael Almeida,我想要的代码是:body=tree.xpath('//div[contains(@title,“name”)]//*)你是个好人,要认真回答。最美好的祝福!此外,如果您有一些关于xpath的资料链接或教程,请告诉我!无论如何,非常感谢!这不是OP要求的@拉斐拉梅达:嗯,也许你是对的,因为“获取所有元素”Thanks@hr_117还有@Rafael Almeida,我想要的代码是:body=tree.xpath('//div[contains(@title,“name”)]//*)你是个好人,要认真回答。最美好的祝福!此外,如果您有一些关于xpath的资料链接或教程,请告诉我!无论如何,非常感谢!