使用lxml和Python解析输入标记的一部分
我有一个如下所示的输入标记:使用lxml和Python解析输入标记的一部分,python,html,web-scraping,lxml,Python,Html,Web Scraping,Lxml,我有一个如下所示的输入标记: <input name="sheet" value="5B" tabindex="994" data-enpassid="__11" type="submit"> 不,我只想获取给定给value属性的内容(本例中为5B)。是否可以使用lxml,如果可以,如何使用?试试这个。我使用css选择器和xpath创建了两个表达式。它们都将为您提供5B,结果如下: html=''' <input name="sheet" value="5B" tabin
<input name="sheet" value="5B" tabindex="994" data-enpassid="__11" type="submit">
不,我只想获取给定给value属性的内容(本例中为5B)。是否可以使用lxml,如果可以,如何使用?试试这个。我使用css选择器和xpath创建了两个表达式。它们都将为您提供
5B
,结果如下:
html='''
<input name="sheet" value="5B" tabindex="994" data-enpassid="__11" type="submit">
'''
from lxml.html import fromstring
root = fromstring(html)
item = root.cssselect("input")[0].attrib['value']
item1 = root.xpath("//input/@value")[0]
print(item, item1)
你的意思是你想要输入元素的实际
值
,例如,案例的预期输出是5B
?再次阅读我的问题,我注意到这甚至不是一个span标记,而是一个输入标记。不知道这是怎么发生的,但如果引起混乱,我很抱歉。
5B, 5B