Scrapy 如何通过刮取网页来确定网站的名称?

Scrapy 如何通过刮取网页来确定网站的名称?,scrapy,web-crawler,Scrapy,Web Crawler,假设在我的浏览器中打开了某个网页,我使用scrapy废弃了源代码。如何识别网站的名称。我的意思是它可以在任何标签。如何唯一地识别它???您可以在中查找标记 例如,您可以使用类似以下内容:response.xpath('//title')您的问题不清楚,请尝试改进:)您可以使用response.url、通过URLPrasse解析的域、页面标题以及任何内容来识别它。你能解释一下吗,你的意思是什么?定义“网站名称”。域名?页面?如果我想提取网页的url,那该怎么办?不客气,您可以从对象响应中执行以下操

假设在我的浏览器中打开了某个网页,我使用scrapy废弃了源代码。如何识别网站的名称。我的意思是它可以在任何标签。如何唯一地识别它???

您可以在中查找标记


例如,您可以使用类似以下内容:
response.xpath('//title')

您的问题不清楚,请尝试改进:)您可以使用
response.url
、通过URLPrasse解析的域、页面标题以及任何内容来识别它。你能解释一下吗,你的意思是什么?定义“网站名称”。域名?页面
?如果我想提取网页的url,那该怎么办?不客气,您可以从对象响应中执行以下操作:
response.request.url
,以获取url。希望能有帮助。