此页上这些表行的XPATH是什么？我能'；我想不出来！_Xpath_Screen Scraping

此页上这些表行的XPATH是什么？我能'；我想不出来！

xpath

此页上这些表行的XPATH是什么？我能'；我想不出来！,xpath,screen-scraping,Xpath,Screen Scraping,我从未有过像这次这样的任务：抓取网页。我试图解析来自Omgili API结果页面的评论。示例页面位于此处：我之前已经浏览了很多页面，但是这个页面结果的确切XPATH非常棘手，因为没有DIV类名，并且有5个嵌套表。我希望XPath能够返回每个结果的所有表行（例如，第一个结果是包含第一次审阅的TR:“确实做了它需要做的事情-[2010年2月3日]”）及其内容这方面有什么帮助吗，或者至少给我指出一个可以帮助我的资源？我已经尝试过CHrome选择器小工具，但这对这个网站都不起作用目前我已经尝试了

我从未有过像这次这样的任务：抓取网页。我试图解析来自Omgili API结果页面的评论。示例页面位于此处：

我之前已经浏览了很多页面，但是这个页面结果的确切XPATH非常棘手，因为没有DIV类名，并且有5个嵌套表。我希望XPath能够返回每个结果的所有表行（例如，第一个结果是包含第一次审阅的TR:“确实做了它需要做的事情-[2010年2月3日]”）及其内容

这方面有什么帮助吗，或者至少给我指出一个可以帮助我的资源？我已经尝试过CHrome选择器小工具，但这对这个网站都不起作用

目前我已经尝试了以下方法，但失败了：

//table//table//tr[4]//table/tr/td[1]/table/tr

，我可能会试图作弊（如果有效的话！），请注意，审阅链接是该页面上唯一具有启动

jmp

目标的链接

//tr[td/span/a[starts-with(@href, 'jmp')]]

应该是您想要的行。

这个查询怎么样：

//form [Name='f']//table[2]//table[3]//table/tr

我使用iRobotSoft Web Scraper将其从HTQL翻译过来：

<form (Name='f')>1.<table>2.<table>3.<table>1.<tr>

1.2.3.1。

它也可以工作（之后）：

//a[以（@href，/jmp'）开头]/祖先：：tr[1]

你试过寻找FF附加组件吗？有更多的XPATH附加组件（如Firebug的Firefinder）可以工作，谢谢！这是我见过的最糟糕的XPATH，但它可以工作：/html/body/form/table//tr/td/table//tr[4]/td/table//tr/td/tr/td[1]/table//[position（）>1]我认为XPath不是适合这项工作的工具。HTML太混乱了：