Python Xpath在scrapy中不工作,尽管在chrome中工作
尝试: 打印:Python Xpath在scrapy中不工作,尽管在chrome中工作,python,scrapy,Python,Scrapy,尝试: 打印:None date = response.xpath('//*[@id="page_match_1_block_match_info_5"]/div[2]/div[2]/div[1]/dl/dd[2]/a/text()').get() 打印: 但是我需要:2020年4月3日您需要在Xpath路由文本()中添加最后一个字符串 在您的特定情况下,完成Xpath路由 date = response.xpath('//*[@id="page_match_1_block_match_inf
None
date = response.xpath('//*[@id="page_match_1_block_match_info_5"]/div[2]/div[2]/div[1]/dl/dd[2]/a/text()').get()
打印:
但是我需要:
2020年4月3日
您需要在Xpath路由文本()中添加最后一个字符串
在您的特定情况下,完成Xpath路由
date = response.xpath('//*[@id="page_match_1_block_match_info_5"]/div[2]/div[2]/div[1]/dl/dd[2]/a').get()
<a href="/">HOME</a>
最终Xpath:
“//[@id=“页面匹配1块匹配信息5”]/div[2]/div[2]/div/dl/dd[2]/a/span/text()”
例如:
假设您想从这组HTML标记中提取单词HOME
HTML:
输出:
# Both selectors (extract_first, get) will obtain the same result.
# Add the text() component as a final str. into the Xpath route.
response.xpath('//*[@class="main-nav mobileNav"]/ul/li/a/text()').extract_first()
response.xpath('//*[@class="main-nav mobileNav"]/ul/li/a/text()').get()
说明:
您需要在正在访问的实际节点内部找到文本类型的节点
'HOME'
将生成a标记所包含的文本
'../a/text()'
参考资料:您是否尝试过使用
a/span/text()
@JustinEzequiel()结束xpath解决了这个问题,您可以链接到相关文档吗?无需文档;我刚看过你的XML。span
是a
元素的子元素,您希望获取span@JustinEzequiel一直以来,阅读文档、参考资料和示例都是一种很好的方式,不要忘记这一点。我们非常欢迎您发布相关文档的链接,@FrancoGil。
<a href="/">HOME</a>
'../a/text()'
'HOME'