Python Scrapy-xml爬网中的xpath问题

Python Scrapy-xml爬网中的xpath问题,python,xml,xpath,scrapy,scrapy-spider,Python,Xml,Xpath,Scrapy,Scrapy Spider,我正在尝试制作一个简单的爬行器来抓取一些xml,并将其以一种新的格式输出,以便进行实验。然而,xml中似乎包含了额外的代码,这些代码被吐出。我想要的格式是这样的(没有额外的代码或值标记),大致如下:这个周末别忘了我 我认为我使用xpath是错误的,但我不确定我做错了什么 蜘蛛 from scrapy.contrib.spiders import XMLFeedSpider from crawler.items import CrawlerItem class SiteSpider(XMLFee

我正在尝试制作一个简单的爬行器来抓取一些xml,并将其以一种新的格式输出,以便进行实验。然而,xml中似乎包含了额外的代码,这些代码被吐出。我想要的格式是这样的(没有额外的代码或值标记),大致如下:
这个周末别忘了我

我认为我使用xpath是错误的,但我不确定我做错了什么

蜘蛛

from scrapy.contrib.spiders import XMLFeedSpider
from crawler.items import CrawlerItem

class SiteSpider(XMLFeedSpider):
    name = 'site'
    allowed_domains = ['www.w3schools.com']
    start_urls = ['http://www.w3schools.com/xml/note.xml']
    itertag = 'note'

    def parse_node(self, response):
        xxs = XmlXPathSelector(response)
        to = xxs.select('//to')
        who = xxs.select('//from')
        heading = xxs.select('//heading')   
        body = xxs.select('//body')           
        return item
输入

<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

托弗
贾尼
提醒
这个周末别忘了我!
当前(错误)输出


这个周末别忘了我/身体
托托
fromJani/from
标题提醒/标题
的签名不正确。应该有一个
selector
参数,您应该在该参数上调用
xpath()
方法,例如:

def parse_node(self, response, selector):
    to = selector.xpath('//to/text()').extract()
    who = selector.xpath('//from/text()').extract()
    print to, who
印刷品:

[u'Tove'] [u'Jani']

这似乎给了我这个错误:
File”/usr/local/lib/python2.7/dist packages/scrapy/contrib/spidermiddleware/depth.py“,第50行,作为回报(r表示结果中的r或()if_filter(r))文件/usr/local/lib/python2.7/dist packages/scrapy/contrib/spider/feed.py”,第62行,在parse\u节点ret=iterate\u spider\u输出(sel.parse\u节点(响应,选择器)文件“/usr/local/lib/python2.7/dist packages/scrapy/contrib/spider/feed.py”,第51行,在parse_节点中引发NotImplementedError异常。NotImplementedError:
@JamesWillson请检查缩进并确保存在
parse_节点()
在您的spider类中定义的方法。如果问题仍然存在,请告诉我您使用的是哪一个scrapy版本,并显示您当前的代码。谢谢。我仍在努力,恐怕我已经将所有代码都放在这里了,您是否有机会看一看:@JamesWillson是的,您应该缩进
parse_node()
。我明白了,对不起,我自己才知道。非常感谢
[u'Tove'] [u'Jani']