Python 使用xpath提取值会产生一些不需要的字符串
我正在从网页中提取值(webscraping)。我可以成功地得到包含所需值的行,但是,我希望得到值本身。我做得对吗?它真的需要额外的条纹步骤吗Python 使用xpath提取值会产生一些不需要的字符串,python,python-3.x,xpath,web-scraping,lxml,Python,Python 3.x,Xpath,Web Scraping,Lxml,我正在从网页中提取值(webscraping)。我可以成功地得到包含所需值的行,但是,我希望得到值本身。我做得对吗?它真的需要额外的条纹步骤吗 lxml.html title = doc.xpath('//*[@class="tytng"]') print (lh.tostring(title[0])) 网页编码: <span class="tytng" style="">06MAGNA (06N)</span> 实际结果: b'<span c
lxml.html
title = doc.xpath('//*[@class="tytng"]')
print (lh.tostring(title[0]))
网页编码:
<span class="tytng" style="">06MAGNA (06N)</span>
实际结果:
b'<span class="tytng">06MAGNA (06N)</span>'
b'06MAGNA ;(06N)'
如果我正确理解您的问题,您可以使用“.text”。例如:
title = driver.find_element_by_xpath('//*[@class="tytng"]')
print(title.text)
如果我正确理解你的问题,你可以使用“.text”。例如:
title = driver.find_element_by_xpath('//*[@class="tytng"]')
print(title.text)
print(title[0].text)
?或在xpath-title=doc.xpath('/*[@class=“tytng”]/text())
print(title[0])
打印(title[0].text)
工作正常:-print(title[0].text)
?或在xpath-title=doc.xpath('//*/code>中使用text()
text()
print(title[0])
print(title[0].text)
这很好:-)print(title.text)
给了我一个错误:AttributeError:'list'对象没有属性'text'@Wojtas.Zet如果你看到单词“list”
有错误,那么就用[0]
-title[0]试试看。text
就像furas说的那样,试试看“通过xpath查找元素”,然后是title[index]。text什么是驱动程序?什么是通过xpath查找元素?它们在问题中不存在。print(title.text)
给了我错误:AttributeError:'list'对象没有属性'text'@Wojtas.Zet如果你看到word“list”
有错误,只需尝试[0]
-title[0]。text
正如furas所说,尝试“通过xpath查找元素”,然后尝试title[index]。text什么是驱动程序?什么是通过xpath查找元素?问题中不存在它们。