简单XPath表达式在Python中不起作用
我试图解析一个基于设计的web文档表,我有一个div,里面有一个表简单XPath表达式在Python中不起作用,python,xpath,python-2.7,scrapy,Python,Xpath,Python 2.7,Scrapy,我试图解析一个基于设计的web文档表,我有一个div,里面有一个表 <div id="component"> <table ...> .... 这项工作: [<XmlXPathSelector xpath="//*[@id='component']" data=u'<div xmlns="http://www.w3.org/1999/xhtml'>] 这将返回一个空结果。我尝试使用其他选择器,如/*[@id='component']
<div id="component">
<table ...>
....
这项工作:
[<XmlXPathSelector xpath="//*[@id='component']" data=u'<div xmlns="http://www.w3.org/1999/xhtml'>]
这将返回一个空结果。我尝试使用其他选择器,如/*[@id='component']/tr和/*[@id='component']/a,但它们也不起作用
有什么想法吗?:p我解决了这个问题,我用XmlPathSelector而不是*HTML*PathSelector:p我解决了这个问题,我用XmlPathSelector而不是*HTML*PathSelector请发布HTML文档。根据您的示例,它应该是新闻,而不是组件。是的,我知道,我是作为示例编写这个HTML的,这不是问题。请发布html文档。从您的示例来看,它应该是新闻,而不是组件。是的,我知道,我是作为示例编写此html的,这不是问题。
[<XmlXPathSelector xpath="//*[@id='component']" data=u'<div xmlns="http://www.w3.org/1999/xhtml'>]
XmlXPathSelector(response).select("//*[@id='component']/table")