Python Xpath,用于使用类(Scrapy)查找定位标记内部的文本
我正在尝试使用Xpath提取锚定标记的链接 网址Python Xpath,用于使用类(Scrapy)查找定位标记内部的文本,python,xpath,scrapy,Python,Xpath,Scrapy,我正在尝试使用Xpath提取锚定标记的链接 网址 代码 item[“category”]=str( response.xpath( “//a[@class=“text size-1x-small font重音颜色品牌所有大写”]/text() ).摘录() ) 还有python函数 def parseSave(self,response): item=NYtimesItem() 项[“类别”]=response.xpath( “//a[@class=“text size-1x-small
代码
item[“category”]=str(
response.xpath(
“//a[@class=“text size-1x-small font重音颜色品牌所有大写”]/text()
).摘录()
)
还有python函数
def parseSave(self,response):
item=NYtimesItem()
项[“类别”]=response.xpath(
“//a[@class=“text size-1x-small font重音颜色品牌所有大写”]/text()
).摘录()
收益项目
请告诉我我做错了什么
预期的输出将是锚定标记的文本。e、 g Business/text()
用于获取元素的内部文本。要提取href属性,请改用/@href
您所在的URL是什么?此外,不需要对结果调用
str
。这是主要问题。你确定你得到了正确的答复吗?当我使用XPath时,它返回['Business']
(即在列表中)。如果您只需要字符串,请使用.get()
而不是.extract()
。如果您没有得到任何东西,请发布其余的代码。在观察我的响应后,似乎有些链接给了我“值”有些不是因为旧的结构,因为在它们的旧链接中,它们从不同的css类中得到相同的东西,我正在添加我的代码