Python 为什么我的代码返回空白？（用刮痧刮）_Python_Scrapy_Web Crawler_Screen Scraping

Python 为什么我的代码返回空白？（用刮痧刮）

python scrapy web-crawler

Python 为什么我的代码返回空白？（用刮痧刮）,python,scrapy,web-crawler,screen-scraping,Python,Scrapy,Web Crawler,Screen Scraping,我的目标是按照一周中的某一天来整理漫画，并将其保存到excel数据表中。我的消息来源是我已经成功地通过终端直接抓取数据，并希望为整个过程编写一个合适的脚本，但没有太大的成功使用response.xpath//div[@class='list\u area daily\u all']/div[1]/div/h4/span/text.extract直接通过终端抓取数据将正确生成数据。平日是从div[1~7]订购的，此代码周一返回下面的代码返回星期一漫画的列表。 response.xpath//

我的目标是按照一周中的某一天来整理漫画，并将其保存到excel数据表中。我的消息来源是

我已经成功地通过终端直接抓取数据，并希望为整个过程编写一个合适的脚本，但没有太大的成功

使用response.xpath//div[@class='list\u area daily\u all']/div[1]/div/h4/span/text.extract直接通过终端抓取数据将正确生成数据。平日是从div[1~7]订购的，此代码周一返回

下面的代码返回星期一漫画的列表。 response.xpath//div[@class='list\u area daily\u all']/div[1]/div//ul/li/a[@class='title']/text.extract

但是，以下代码不会返回所需的结果

def parse(self, response):
    for webtoon in response.xpath("//div[@class='list_area daily_all']/div/div"):
        yield {
            'Day': webtoon.xpath('/h4/span/text()').extract(),
            'Title': webtoon.xpath("/ul/li/a[@class='title']/text()").extract(),
        }

预期结果将是以下代码的7行，按星期几的顺序排列 {'Day'：[Day]，'Title'：[title1，title2，title3]}

但是，我的代码正在返回 {'Day'：[]，'Title'：[]}

我希望这一切都是有意义的。

你需要用一个新的名字开始你的一天。圆点

当您这样做时，不使用response.xpath并不重要，您仍然在尝试在XML的根位置获取一个h4元素，而不是在list\u area daily\u all div之后获取一个h4标记

正确的方法是添加一个。在/h4之前，此点引用以前xpath选择器的当前位置

webtoon.xpath('./h4/span/text()').extract()

我的天啊，我知道答案，但就是连点都连不上。非常感谢，这只是我网络爬行旅程中的一块垫脚石，我已经为下一步做好了准备。事实上，你可以直接使用h4，而不是。如果元素之前没有/，则假定为。

webtoon.xpath('./h4/span/text()').extract()