Python Xpath只指向父变量，而不指向整个页面_Python_Xpath_Html Table_Lxml

Python Xpath只指向父变量，而不指向整个页面

python xpath

Python Xpath只指向父变量，而不指向整个页面,python,xpath,html-table,lxml,Python,Xpath,Html Table,Lxml,我试图从表中获取数据，但遇到了一个问题，即必须从特定的表数据单元获取数据 #! /usr/bin/python import urllib from lxml import html url="http://kforce.com/Jobs/Search.aspx?Location=&Specialty=Technology-Jobs&Keyword=" pageHtml = html.fromstring(urllib.urlopen(url).read()) #id="

我试图从表中获取数据，但遇到了一个问题，即必须从特定的表数据单元获取数据

#! /usr/bin/python

import urllib
from lxml import html

url="http://kforce.com/Jobs/Search.aspx?Location=&Specialty=Technology-Jobs&Keyword="

pageHtml = html.fromstring(urllib.urlopen(url).read())

#id="Body_SearchResultsControl_grdJobs"

#row class jobResultsAlternateRow || jobResultsRowStyle

jobs = pageHtml.xpath("//table[@id='Body_SearchResultsControl_grdJobs']/tr[@class='jobResultsAlternateRow' or @class='jobResultsRowStyle']");

for i in jobs:
        cols = i.getchildren() #get all table data cells
        print(cols[0].xpath('//a/@href'))
        exit(0)

xpath应用于页面上的所有链接，而不仅仅是我分配给它的列。我不太熟悉XPath，但我不确定它是XPath查询还是我使用的XPath查询。

如果要开始在元素内部而不是根中搜索，应该使用

：

print(cols[0].xpath('.//a/@href'))

打印

['Job.aspx？Job=1696~EQG~1259184T1~99&keyword=']

-我想这就是您想要的

希望对您有所帮助。

如果您希望开始在元素内部而不是根目录中搜索，则应使用

：

print(cols[0].xpath('.//a/@href'))

打印

['Job.aspx？Job=1696~EQG~1259184T1~99&keyword=']

-我想这就是您想要的

希望有帮助。

ha！我会把这些加在我的清单上。泰！我会在9分钟内选择这个作为答案（Stackoverflow！！！！）哈！我会把这些加在我的清单上。泰！我会在9分钟内选择这个作为答案（Stackoverflow！！！！）