XPATH-如何使用OR语句获取div类?

XPATH-如何使用OR语句获取div类?,xpath,Xpath,我正在使用XPATH从html网页获取信息。有时,URL在某些页面上会略有变化,但我需要的“新URL”将出现在具有特定类的div中的旧URL上 所以我需要做的是使用XPATH查询来查找这个div并返回它的内容——href——或者只返回旧的URL 如何为此编写查询 例如: <div class='old-url'>www.example.com/old-url</div> <div class='new-url'>www.example.com/new-url

我正在使用XPATH从html网页获取信息。有时,URL在某些页面上会略有变化,但我需要的“新URL”将出现在具有特定类的div中的旧URL上

所以我需要做的是使用XPATH查询来查找这个div并返回它的内容——href——或者只返回旧的URL

如何为此编写查询

例如:

<div class='old-url'>www.example.com/old-url</div>

<div class='new-url'>www.example.com/new-url</div>
www.example.com/old-url
www.example.com/new-url
所以我想基本上说‘退回旧的,除非你在那里看到新的,如果是这样的话,退回新的。’

以下是一个示例:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html xmlns:fb="http://www.facebook.com/2008/fbml" xmlns:og="http://opengraphprotocol.org/schema/">
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8"/>
<link rel="alternate" hreflang="en" href="http://www.example.com"/>

<div id="" class="pgLinks">
<a href="/example-text" class="guiArw sprite-pagePrev ">&laquo;</a>
<a href="/example-text-2" class="paging taLnk ">1</a>
<span class="paging pageDisplay">2</span>

2.

假设您有以下xml(作为html的一部分):


www.example.comnew-url
www.example.comold-url
想法是选择两者,但只有当新url元素的计数为0时,才选择旧url:


/div/div[@class='new-url'或(@class='old-url'和count(./../div[@class='new-url'])=0)]

对于未来的问题,请确保:检查格式(HTML被解析而不是打印),并包括您尝试的内容。发布有效的标记和代码也是一种良好的礼仪,错误的标记/代码和格式总是表明在发布问题时缺乏努力,并且会降低获得好答案的机会。你看了吗?抱歉@jens,我不知道这是错的。我会更加小心的。
<div>
  <div class='new-url'>www.example.comnew-url</div>
  <div class='old-url'>www.example.comold-url</div>
</div>