在Python中,当链接没有类时,使用Xpath获取链接的锚文本

在Python中,当链接没有类时,使用Xpath获取链接的锚文本,python,xpath,lxml,Python,Xpath,Lxml,(免责声明:我只对python知之甚少&我对编码相当陌生) 我试图获取的是a的文本部分,但它没有特定的类,根据我如何编写代码,我得到的内容可能太多(xpath不够具体),也可能是一个空白[] 我试图访问的内容的屏幕截图是: 树是页面中的所有html。 返回空白的代码是: cardInfo=tree.xpath('div[@class=“cardDetails”]/table/tbody/tr/td[2]/a/text()) 返回太多的代码: cardInfo=tree.xpath('a[包含(

(免责声明:我只对python知之甚少&我对编码相当陌生)

我试图获取的是a的文本部分,但它没有特定的类,根据我如何编写代码,我得到的内容可能太多(xpath不够具体),也可能是一个空白[]

我试图访问的内容的屏幕截图是:

树是页面中的所有html。 返回空白的代码是:

cardInfo=tree.xpath('div[@class=“cardDetails”]/table/tbody/tr/td[2]/a/text())

返回太多的代码:

cardInfo=tree.xpath('a[包含(@href,'domain_name')]/text())


我尝试在chrome中进入Inspect并复制xpath,但也没有得到任何结果。我已经成功地从页面中获取了纯文本,而不是链接。非常抱歉,如果我没有解释清楚,但是有人知道我能写什么吗?

如果您想在
集合名称旁边找到文本:

>>> import lxml.html
>>> tree = lxml.html.parse('http://shop.tcgplayer.com/pokemon/jungle/nidoqueen-7')
>>> tree.xpath(".//b[text()='Set Name:']/parent::td/following-sibling::td/a/text()")
['Jungle']
  • //b[text()='Set Name:']
    查找
    b
    带有
    Set Name:
    text的标记
  • parent::td
    -它的父td元素
  • 后面的同级::td
    -后面的td元素

请向我们提供您正在删除的URL,非常抱歉!您正在使用lxml,对吗?是的,lxml和请求