此页上这些表行的XPATH是什么?我能';我想不出来!

此页上这些表行的XPATH是什么?我能';我想不出来!,xpath,screen-scraping,Xpath,Screen Scraping,我从未有过像这次这样的任务:抓取网页。我试图解析来自Omgili API结果页面的评论。示例页面位于此处: 我之前已经浏览了很多页面,但是这个页面结果的确切XPATH非常棘手,因为没有DIV类名,并且有5个嵌套表。我希望XPath能够返回每个结果的所有表行(例如,第一个结果是包含第一次审阅的TR:“确实做了它需要做的事情-[2010年2月3日]”)及其内容 这方面有什么帮助吗,或者至少给我指出一个可以帮助我的资源?我已经尝试过CHrome选择器小工具,但这对这个网站都不起作用 目前我已经尝试了

我从未有过像这次这样的任务:抓取网页。我试图解析来自Omgili API结果页面的评论。示例页面位于此处:

我之前已经浏览了很多页面,但是这个页面结果的确切XPATH非常棘手,因为没有DIV类名,并且有5个嵌套表。我希望XPath能够返回每个结果的所有表行(例如,第一个结果是包含第一次审阅的TR:“确实做了它需要做的事情-[2010年2月3日]”)及其内容

这方面有什么帮助吗,或者至少给我指出一个可以帮助我的资源?我已经尝试过CHrome选择器小工具,但这对这个网站都不起作用

目前我已经尝试了以下方法,但失败了:
//table//table//tr[4]//table/tr/td[1]/table/tr
,我可能会试图作弊(如果有效的话!),请注意,审阅链接是该页面上唯一具有启动
jmp
目标的链接

//tr[td/span/a[starts-with(@href, 'jmp')]]
应该是您想要的行。

这个查询怎么样:

//form [Name='f']//table[2]//table[3]//table/tr
我使用iRobotSoft Web Scraper将其从HTQL翻译过来:

<form (Name='f')>1.<table>2.<table>3.<table>1.<tr>
1.2.3.1。
它也可以工作(之后):


//a[以(@href,/jmp')开头]/祖先::tr[1]

你试过寻找FF附加组件吗?有更多的XPATH附加组件(如Firebug的Firefinder)可以工作,谢谢!这是我见过的最糟糕的XPATH,但它可以工作:/html/body/form/table//tr/td/table//tr[4]/td/table//tr/td/tr/td[1]/table//[position()>1]我认为XPath不是适合这项工作的工具。HTML太混乱了: