Python 使用scrapy从xpath响应中获取列表每行的布尔值
使用Python 使用scrapy从xpath响应中获取列表每行的布尔值,python,list,xpath,scrapy,Python,List,Xpath,Scrapy,使用scrapy时,我有一个xpath响应,返回一个列表。我想检查列表的每一行是否包含字符串。所以结果应该是一个布尔值列表 如何使用scrapy和response.xpath 这是我的解决方法: 因为scrapy使用的是XPath 1,所以我必须构建一个变通方法,因为在XPath 1中,每个节点都是唯一的。因此,XPath1只能返回每个标题一次。这就是我为解决问题所做的: 问题: 标题1 文本1 文本2 文本3 标题2 文本4 文本5 文本6 结果: 真的 真的 我想要得到的是这样的东西: 真
scrapy
时,我有一个xpath
响应,返回一个列表。我想检查列表的每一行是否包含字符串。所以结果应该是一个布尔值列表
如何使用scrapy
和response.xpath
这是我的解决方法:
因为scrapy使用的是XPath 1,所以我必须构建一个变通方法,因为在XPath 1中,每个节点都是唯一的。因此,XPath1只能返回每个标题一次。这就是我为解决问题所做的:
问题:
标题1
文本1
文本2
文本3 标题2
文本4
文本5
文本6
结果:
真的
真的
我想要得到的是这样的东西:
真的
真的
假的
真的
真的
假的
因此,我没有使用Xpath选择器来检索布尔值,而是使用scrapy来检索整页源代码。然后,我根据需要使用标准的python字符串操作和循环来迭代这个字符串。主要问题是Xpath 1只能返回每个节点一次。如果要检查每个列表项是否包含字符串,则可以使用另一种方法
如果考虑下面的示例HTML,请在列表项文本中查找没有“代码>水果<代码> >的列表项。
苹果果
猕猴桃
不应选择此选项
柑橘类水果
什么是输入、期望的输出以及您已经做了什么?