Python 为什么我的代码返回空白?(用刮痧刮)

Python 为什么我的代码返回空白?(用刮痧刮),python,scrapy,web-crawler,screen-scraping,Python,Scrapy,Web Crawler,Screen Scraping,我的目标是按照一周中的某一天来整理漫画,并将其保存到excel数据表中。我的消息来源是 我已经成功地通过终端直接抓取数据,并希望为整个过程编写一个合适的脚本,但没有太大的成功 使用response.xpath//div[@class='list\u area daily\u all']/div[1]/div/h4/span/text.extract直接通过终端抓取数据将正确生成数据。平日是从div[1~7]订购的,此代码周一返回 下面的代码返回星期一漫画的列表。 response.xpath//

我的目标是按照一周中的某一天来整理漫画,并将其保存到excel数据表中。我的消息来源是

我已经成功地通过终端直接抓取数据,并希望为整个过程编写一个合适的脚本,但没有太大的成功

使用response.xpath//div[@class='list\u area daily\u all']/div[1]/div/h4/span/text.extract直接通过终端抓取数据将正确生成数据。平日是从div[1~7]订购的,此代码周一返回

下面的代码返回星期一漫画的列表。 response.xpath//div[@class='list\u area daily\u all']/div[1]/div//ul/li/a[@class='title']/text.extract

但是,以下代码不会返回所需的结果

def parse(self, response):
    for webtoon in response.xpath("//div[@class='list_area daily_all']/div/div"):
        yield {
            'Day': webtoon.xpath('/h4/span/text()').extract(),
            'Title': webtoon.xpath("/ul/li/a[@class='title']/text()").extract(),
        }
预期结果将是以下代码的7行,按星期几的顺序排列 {'Day':[Day],'Title':[title1,title2,title3]}

但是,我的代码正在返回 {'Day':[],'Title':[]}


我希望这一切都是有意义的。

你需要用一个新的名字开始你的一天。圆点

当您这样做时,不使用response.xpath并不重要,您仍然在尝试在XML的根位置获取一个h4元素,而不是在list\u area daily\u all div之后获取一个h4标记

正确的方法是添加一个。在/h4之前,此点引用以前xpath选择器的当前位置

webtoon.xpath('./h4/span/text()').extract()

我的天啊,我知道答案,但就是连点都连不上。非常感谢,这只是我网络爬行旅程中的一块垫脚石,我已经为下一步做好了准备。事实上,你可以直接使用h4,而不是。如果元素之前没有/,则假定为。
webtoon.xpath('./h4/span/text()').extract()