Python 在html表中使用lxml获取href的值_Python_Html_Lxml

Python 在html表中使用lxml获取href的值

python html

Python 在html表中使用lxml获取href的值,python,html,lxml,Python,Html,Lxml,我有一个html表格。在那张桌子上我有 <td>abc</td><a>www.abc.com</a> abcwww.abc.com 如何使用匹配td值的方法获得链接值例如：如何获取www.abc.com使用lxml搜索tect abc的值？a/text（）获取文本 a/@href获取属性（href在本例中） UPD >>> from lxml import etree >>> etree.fromst

我有一个html表格。
在那张桌子上我有

<td>abc</td><a>www.abc.com</a>

abcwww.abc.com

如何使用匹配td值的方法获得链接值

例如：如何获取www.abc.com使用lxml搜索tect abc的值？

a/text（）

获取文本

a/@href

获取属性（

href

在本例中）

UPD

>>> from lxml import etree
>>> etree.fromstring('<html><td>abc</td><a>www.abc.com</a></html>').xpath("//td/following-sibling::a/text()")
['www.abc.com']

来自lxml导入etree的

>>
>>>etree.fromstring（'abc
是的，但是我如何通过搜索abc.doc.xpath（'/a/text（）'）来获取www.abc.com？我已经添加了一些内容来获取相同文本的链接？