Web scraping 使用jsoup从web获取特定元素
我想从这里得到原子钟,我写了这个程序Web scraping 使用jsoup从web获取特定元素,web-scraping,jsoup,Web Scraping,Jsoup,我想从这里得到原子钟,我写了这个程序 import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import java.io.*; import java.util.*; public class da { /** * @param args */ public static void main(St
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.*;
import java.util.*;
public class da {
/**
* @param args
*/
public static void main(String[] args) {
try{
Document doc=Jsoup.connect("http://watches.uhrzeit.org/atomic-clock.php").get();
Elements spans = doc.select("span[id=anzeige_std]");
System.out.println(spans.text());
}
catch(Exception e)
{
e.printStackTrace();
}
}
}
问题是为什么它不打印任何内容(我在这方面不在行,我想学习)。首先,要根据元素id选择元素,请使用格式
element\id
。您拥有它的方式适用于其他属性
其次,时钟在这个html上:
<div id="timer">
<div id="timeText">
<h2>current time CET</h2>
<div id="anzeige_zeit">22:03:10</div>
<div id="anzeige_datum">Tuesday, 2. August 2016</div>
<div id="anzeige_kw">calendar week 31</div>
</div>
</div>
输出
22:08:05
至于div#anzeige#zeit中的#代表什么?@User124235#就是我们如何选择id属性。对于其他属性,使用div[attr=value],例如
22:08:05