Python 在html表中使用lxml获取href的值
我有一个html表格。Python 在html表中使用lxml获取href的值,python,html,lxml,Python,Html,Lxml,我有一个html表格。 在那张桌子上我有 <td>abc</td><a>www.abc.com</a> abcwww.abc.com 如何使用匹配td值的方法获得链接值 例如:如何获取www.abc.com使用lxml搜索tect abc的值?a/text()获取文本 a/@href获取属性(href在本例中) UPD >>> from lxml import etree >>> etree.fromst
在那张桌子上我有
<td>abc</td><a>www.abc.com</a>
abcwww.abc.com
如何使用匹配td值的方法获得链接值
例如:如何获取www.abc.com使用lxml搜索tect abc的值?a/text()
获取文本
a/@href
获取属性(href
在本例中)
UPD
>>> from lxml import etree
>>> etree.fromstring('<html><td>abc</td><a>www.abc.com</a></html>').xpath("//td/following-sibling::a/text()")
['www.abc.com']
来自lxml导入etree的>>
>>>etree.fromstring('abc是的,但是我如何通过搜索abc.doc.xpath('/a/text()')来获取www.abc.com?我已经添加了一些内容来获取相同文本的链接?