Python 从包含文本SKU的标记的所有标记中提取文本_Python_Selenium_Xpath_Web Scraping_Scrapy

Python 从包含文本SKU的标记的所有标记中提取文本

python selenium xpath web-scraping scrapy

Python 从包含文本SKU的标记的所有标记中提取文本,python,selenium,xpath,web-scraping,scrapy,Python,Selenium,Xpath,Web Scraping,Scrapy,我想从包含文本SKU的所有li标记中提取文本 <ul> <li> 5.875 x 5.875</li> <li><b>SKU</b>: 1TVN-11</li> <li>based name</li> <li>based name1</li> <li>based name2</li> </ul> 如果李不是一直在那

我想从包含文本SKU的所有li标记中提取文本

<ul>
<li> 5.875 x 5.875</li>
<li><b>SKU</b>:        1TVN-11</li>
<li>based name</li>
<li>based name1</li>
<li>based name2</li>
</ul>

如果李不是一直在那里，我会怎么做：

'//b[.="SKU"]/following-sibling::text()[1]'

//代表递归表达式

同样代表编码问题，您的代码/尝试在哪里？我想从包含文本SKU的所有标记中提取文本。5.875 x 5.875 SKU:1TVN-11基于名称基于名称1基于名称2从上面我想提取文本1TVN-11。但有时，此li标记在某些页面中不存在。我现在正在使用xpath.SKU=root.xpath./ul/li/b[.='SKU']/下面的兄弟姐妹：：text[1]将其添加到您的原始帖子中：我不知道为什么我的描述中的标记在浏览器中呈现。但仍然无法提取粗体标记后的文本。因此，缺少的代码存在问题。将它添加到您的帖子中！这是发布一个好问题的基本要求，@Israrulhaq：鉴于你的问题不够清晰，这也是一个很好的答案。

'//b[.="SKU"]/following-sibling::text()[1]'