Scrapy 什么是#&引用;你喜欢用刮擦选择器吗?
我正在学习网上的例子 下面是完整的HTML代码Scrapy 什么是#&引用;你喜欢用刮擦选择器吗?,scrapy,Scrapy,我正在学习网上的例子 下面是完整的HTML代码 <html> <head> <base href='http://example.com/' /> <title>Example website</title> </head> <body> <div id='images'> <a href='image1.html'>Name: My image 1 <br
<html>
<head>
<base href='http://example.com/' />
<title>Example website</title>
</head>
<body>
<div id='images'>
<a href='image1.html'>Name: My image 1 <br /><img src='image1_thumb.jpg' /></a>
<a href='image2.html'>Name: My image 2 <br /><img src='image2_thumb.jpg' /></a>
<a href='image3.html'>Name: My image 3 <br /><img src='image3_thumb.jpg' /></a>
<a href='image4.html'>Name: My image 4 <br /><img src='image4_thumb.jpg' /></a>
<a href='image5.html'>Name: My image 5 <br /><img src='image5_thumb.jpg' /></a>
</div>
</body>
</html>
本教程解释了此命令选择当前选择器上下文的所有子体文本节点
response.css('#images *::text').getall()
我猜“*::text”可能意味着所有的文本节点。“当前选择器上下文”是什么意思?“#”做什么?
css选择器等同于id
,看起来像scrapy
一样威胁它
<div id='images`>
谢谢。“图像”和“*::文本”之间的空格有什么作用?去掉它会导致错误。@JJJohn这也是css选择器的一部分。这就是css知道如何查找当前选择器上下文的后代的原因。其他示例:css('div#imagesa[href='image1.html'])
。它只是意味着“使用href
image1.html查找元素,但使用id
images将搜索范围缩小到div”
<div id='images`>