Java 如何使用jSoup在一个html类中获得多个“a href”中的一个
我必须将HTML中的所有文本元素提取到Java字符串中。但是在不同的字符串中 我有以下代码:Java 如何使用jSoup在一个html类中获得多个“a href”中的一个,java,html,jsoup,href,extract,Java,Html,Jsoup,Href,Extract,我必须将HTML中的所有文本元素提取到Java字符串中。但是在不同的字符串中 我有以下代码: <div class="sb-spieldaten"> <p class="sb-datum hide-for-small"> <a href="/jumplist/spieltag/wettbewerb/C1/saison_id/2014/spieltag/2">2. Spieltag</a>
<div class="sb-spieldaten">
<p class="sb-datum hide-for-small">
<a href="/jumplist/spieltag/wettbewerb/C1/saison_id/2014/spieltag/2">2. Spieltag</a>
|
<a href="/aktuell/waspassiertheute/aktuell/new/datum/2014-07-26">Sa., 26.07.2014</a>
| 17:45 Uhr
</p>
<p class="sb-datum show-for-small">
<a href="/jumplist/spieltag/wettbewerb/C1/saison_id/2014/spieltag/2">2. Spieltag</a>
<br />
<a href="/aktuell/waspassiertheute/aktuell/new/datum/2014-07-26">26.07.2014</a>
<br>
17:45 Uhr
</p>
<div class="ergebnis-wrap">
<div class="sb-ergebnis">
<div class="sb-endstand">2:3
<div class="sb-halbzeit">(<span>2:</span>2)
</div>
</div>
</div>
</div>
<p class="sb-zusatzinfos">
<span class="hide-for-small">
<a href="/stadion/stadion/verein/504/saison_id/2014">Letzigrund</a>
|
<strong>4.200 Zuschauer</strong>
<br />
</span>
<strong>Schiedsrichter:</strong>
<br class="show-for-small" />
<a title="Fedayi San" href="/fedayi-san/profil/schiedsrichter/4791">Fedayi San</a>
</p>
</div>
但是通过这个,我提取了类中的所有字符串。所以我得到的答案是:2。斯皮尔塔格公司,2014年7月26日17:45 Uhr 2。斯皮尔塔2014年7月26日17:45 Uhr Letzigrund | 4200 Zuschauer Schiedsrichter:Fedayi San
我怎样才能只得到其中一个字符串?我找不到。getElementsByClass。。。可以理解地有没有办法提取特定的a href元素?或者我必须使用.split方法吗?Elements myText=doc.getElementsByClassx
查看相关网页的CSS,找到分配给相关元素的CSS元素的类id。例如代码片段
Document abc = Jsoup.connect("http://www.abc.in/").timeout(0).get();
Elements ee = abc.select("a[href*=xyz]");// all hrefs containing xyz substring
String xyz = ee.first().attr("abs:href");
您想要哪个a href元素?每个人。但是当我知道如何提取一个时,我会用与其他方法相同的方法来提取。要提取的一个必须具有一些独特的属性。这里的属性通常链接到CSS查询[public Elements selectString cssQuery]。
Document abc = Jsoup.connect("http://www.abc.in/").timeout(0).get();
Elements ee = abc.select("a[href*=xyz]");// all hrefs containing xyz substring
String xyz = ee.first().attr("abs:href");