Python 如何从extract_first()输出中删除xpath?

Python 如何从extract_first()输出中删除xpath?,python,xpath,strip,Python,Xpath,Strip,我是Python新手,所以请提前为我的愚蠢行为道歉 我正在从网站上抓取信息,并使用.extract_first()提取元素 我希望输出的只是元素的文本,即“Bob Smith”。但是,似乎xpath是围绕名称打印的: 相关代码: sel = Selector(text=driver.page_source) name = sel.xpath('//li[@class="inline t-24 t-black t-normal break-words"]').extract_first() if

我是Python新手,所以请提前为我的愚蠢行为道歉

我正在从网站上抓取信息,并使用.extract_first()提取元素

我希望输出的只是元素的文本,即“Bob Smith”。但是,似乎xpath是围绕名称打印的:

相关代码:

sel = Selector(text=driver.page_source)
name = sel.xpath('//li[@class="inline t-24 t-black t-normal break-words"]').extract_first()
if name:
     name = name.strip() 
print(name)
'<li class="inline t-24 t-black t-normal break-words">\n            Bob Smith\n          </li>'
输出:

sel = Selector(text=driver.page_source)
name = sel.xpath('//li[@class="inline t-24 t-black t-normal break-words"]').extract_first()
if name:
     name = name.strip() 
print(name)
'<li class="inline t-24 t-black t-normal break-words">\n            Bob Smith\n          </li>'
  • \n Bob Smith\n
  • '
    我试着在网上找到一个解决方案,但还没有找到一个在extract_first()的上下文中处理这个问题的解决方案。如何摆脱xpath,使打印的输出只是元素文本?谢谢。

    尝试使用

    name = sel.xpath('normalize-space(//li[@class="inline t-24 t-black t-normal break-words"])').extract_first()
    
    我在您的问题中的html输出:

    鲍勃·史密斯

    试用

    name = sel.xpath('normalize-space(//li[@class="inline t-24 t-black t-normal break-words"])').extract_first()
    
    我在您的问题中的html输出:

    鲍勃·史密斯


    你必须提到你使用的刮刀,刮痧,美容霜,硒或其他东西。如果是零碎的,请尝试在xpath中传递“/text()”。请检查您是否必须提及您使用的刮刀,刮刀,美容霜,硒或其他东西。如果是零碎的,请尝试在xpath中传递“/text()”。请查收