XPath表达式?
我想从这个网页中提取“日期:2009-09-25,美国东部夏令时下午1:54”XPath表达式?,xpath,Xpath,我想从这个网页中提取“日期:2009-09-25,美国东部夏令时下午1:54” http://auburn.craigslist.org/sha/1392067187.html 但我不明白如何为它编写Xpath表达式 有人能帮我吗 我也从这个页面获得了其他字段。为什么不运行下面这样的regexp呢 'Date:\s+([0-9]{4}-[0-9]{2}-[0-9]{2}.+?\您是否通过TIDY或其他进程运行HTML以将其转换为XHTML?或者如何对该HTML执行XPATH 如果文档格式正确,
http://auburn.craigslist.org/sha/1392067187.html
但我不明白如何为它编写Xpath表达式
有人能帮我吗
我也从这个页面获得了其他字段。为什么不运行下面这样的regexp呢
'Date:\s+([0-9]{4}-[0-9]{2}-[0-9]{2}.+?\您是否通过TIDY或其他进程运行HTML以将其转换为XHTML?或者如何对该HTML执行XPATH 如果文档格式正确,则可能会使用以下XPATH:
/html/body/hr[1]/following-sibling::text()[1]
它在文档中找到第一个HR元素,然后选择它后面的第一个text()节点(其中包含字符串“Date:2009-09-25,1:54PM EDT”该页面似乎不符合XML,因此XPath可能不会有很大帮助。