Python 从包含文本SKU的标记的所有标记中提取文本
我想从包含文本SKU的所有li标记中提取文本Python 从包含文本SKU的标记的所有标记中提取文本,python,selenium,xpath,web-scraping,scrapy,Python,Selenium,Xpath,Web Scraping,Scrapy,我想从包含文本SKU的所有li标记中提取文本 <ul> <li> 5.875 x 5.875</li> <li><b>SKU</b>: 1TVN-11</li> <li>based name</li> <li>based name1</li> <li>based name2</li> </ul> 如果李不是一直在那
<ul>
<li> 5.875 x 5.875</li>
<li><b>SKU</b>: 1TVN-11</li>
<li>based name</li>
<li>based name1</li>
<li>based name2</li>
</ul>
如果李不是一直在那里,我会怎么做:
'//b[.="SKU"]/following-sibling::text()[1]'
//代表递归表达式同样代表编码问题,您的代码/尝试在哪里?我想从包含文本SKU的所有标记中提取文本。5.875 x 5.875 SKU:1TVN-11基于名称基于名称1基于名称2从上面我想提取文本1TVN-11。但有时,此li标记在某些页面中不存在。我现在正在使用xpath.SKU=root.xpath./ul/li/b[.='SKU']/下面的兄弟姐妹::text[1]将其添加到您的原始帖子中:我不知道为什么我的描述中的标记在浏览器中呈现。但仍然无法提取粗体标记后的文本。因此,缺少的代码存在问题。将它添加到您的帖子中!这是发布一个好问题的基本要求,@Israrulhaq:鉴于你的问题不够清晰,这也是一个很好的答案。
'//b[.="SKU"]/following-sibling::text()[1]'