Python 如何从extract_first()输出中删除xpath?
我是Python新手,所以请提前为我的愚蠢行为道歉 我正在从网站上抓取信息,并使用.extract_first()提取元素 我希望输出的只是元素的文本,即“Bob Smith”。但是,似乎xpath是围绕名称打印的: 相关代码:Python 如何从extract_first()输出中删除xpath?,python,xpath,strip,Python,Xpath,Strip,我是Python新手,所以请提前为我的愚蠢行为道歉 我正在从网站上抓取信息,并使用.extract_first()提取元素 我希望输出的只是元素的文本,即“Bob Smith”。但是,似乎xpath是围绕名称打印的: 相关代码: sel = Selector(text=driver.page_source) name = sel.xpath('//li[@class="inline t-24 t-black t-normal break-words"]').extract_first() if
sel = Selector(text=driver.page_source)
name = sel.xpath('//li[@class="inline t-24 t-black t-normal break-words"]').extract_first()
if name:
name = name.strip()
print(name)
'<li class="inline t-24 t-black t-normal break-words">\n Bob Smith\n </li>'
输出:
sel = Selector(text=driver.page_source)
name = sel.xpath('//li[@class="inline t-24 t-black t-normal break-words"]').extract_first()
if name:
name = name.strip()
print(name)
'<li class="inline t-24 t-black t-normal break-words">\n Bob Smith\n </li>'
”\n Bob Smith\n '
我试着在网上找到一个解决方案,但还没有找到一个在extract_first()的上下文中处理这个问题的解决方案。如何摆脱xpath,使打印的输出只是元素文本?谢谢。尝试使用
name = sel.xpath('normalize-space(//li[@class="inline t-24 t-black t-normal break-words"])').extract_first()
我在您的问题中的html输出:
鲍勃·史密斯
试用
name = sel.xpath('normalize-space(//li[@class="inline t-24 t-black t-normal break-words"])').extract_first()
我在您的问题中的html输出:
鲍勃·史密斯
你必须提到你使用的刮刀,刮痧,美容霜,硒或其他东西。如果是零碎的,请尝试在xpath中传递“/text()”。请检查您是否必须提及您使用的刮刀,刮刀,美容霜,硒或其他东西。如果是零碎的,请尝试在xpath中传递“/text()”。请查收