Web scraping 使用jsoup从web获取特定元素

Web scraping 使用jsoup从web获取特定元素,web-scraping,jsoup,Web Scraping,Jsoup,我想从这里得到原子钟,我写了这个程序 import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import java.io.*; import java.util.*; public class da { /** * @param args */ public static void main(St

我想从这里得到原子钟,我写了这个程序

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements; 
import java.io.*;
import java.util.*;
public class da {

/**
 * @param args
 */
public static void main(String[] args) {
try{
    Document doc=Jsoup.connect("http://watches.uhrzeit.org/atomic-clock.php").get();
    Elements spans = doc.select("span[id=anzeige_std]");
    System.out.println(spans.text());

    }
    catch(Exception e)
    {
        e.printStackTrace();
    }
}

}

问题是为什么它不打印任何内容(我在这方面不在行,我想学习)。

首先,要根据元素id选择元素,请使用格式
element\id
。您拥有它的方式适用于其他属性

其次,时钟在这个html上:

<div id="timer">
    <div id="timeText">
        <h2>current time CET</h2>
        <div id="anzeige_zeit">22:03:10</div> 
        <div id="anzeige_datum">Tuesday,  2. August 2016</div>
        <div id="anzeige_kw">calendar week 31</div>
    </div>
</div>
输出

22:08:05
至于div#anzeige#zeit中的#代表什么?@User124235#就是我们如何选择id属性。对于其他属性,使用div[attr=value],例如
22:08:05