Python 刮痧蜘蛛刮去部分内容,留下其他内容
我定义了一个scrapy spider,它可以刮取所有的名字和一些故事,而定义的xpath无法从Python 刮痧蜘蛛刮去部分内容,留下其他内容,python,xpath,scrapy-spider,Python,Xpath,Scrapy Spider,我定义了一个scrapy spider,它可以刮取所有的名字和一些故事,而定义的xpath无法从 我认为您需要将所有段落的文本连接到帖子内容下: Li.add_xpath('story', '//div[@class="post-content"]/div/p/text()', Join(" ")) 其中输出处理器导入为: from scrapy.loader.processors import Join 非常感谢你!拯救了我的早晨@alecxe from scrapy.loader.pro
我认为您需要将所有段落的文本连接到帖子内容下:
Li.add_xpath('story', '//div[@class="post-content"]/div/p/text()', Join(" "))
其中输出处理器导入为:
from scrapy.loader.processors import Join
非常感谢你!拯救了我的早晨@alecxe
from scrapy.loader.processors import Join