Python Xpath，用于使用类（Scrapy）查找定位标记内部的文本_Python_Xpath_Scrapy

Python Xpath，用于使用类（Scrapy）查找定位标记内部的文本

python xpath scrapy

Python Xpath，用于使用类（Scrapy）查找定位标记内部的文本,python,xpath,scrapy,Python,Xpath,Scrapy,我正在尝试使用Xpath提取锚定标记的链接网址代码 item[“category”]=str( response.xpath( “//a[@class=“text size-1x-small font重音颜色品牌所有大写”]/text（） ).摘录（） ) 还有python函数 def parseSave（self，response）： item=NYtimesItem（）项[“类别”]=response.xpath( “//a[@class=“text size-1x-small

我正在尝试使用Xpath提取锚定标记的链接

网址

代码

item[“category”]=str(
response.xpath(
“//a[@class=“text size-1x-small font重音颜色品牌所有大写”]/text（）
).摘录（）
)

还有python函数

def parseSave（self，response）：
item=NYtimesItem（）
项[“类别”]=response.xpath(
“//a[@class=“text size-1x-small font重音颜色品牌所有大写”]/text（）
).摘录（）
收益项目

请告诉我我做错了什么预期的输出将是锚定标记的文本。e、 g Business

/text（）

用于获取元素的内部文本。要提取href属性，请改用

/@href

您所在的URL是什么？此外，不需要对结果调用

str

。这是主要问题。你确定你得到了正确的答复吗？当我使用XPath时，它返回

['Business']

（即在列表中）。如果您只需要字符串，请使用

.get（）

而不是

.extract（）

。如果您没有得到任何东西，请发布其余的代码。在观察我的响应后，似乎有些链接给了我“值”有些不是因为旧的结构，因为在它们的旧链接中，它们从不同的css类中得到相同的东西，我正在添加我的代码