Web scraping 使用jsoup从web获取特定元素_Web Scraping_Jsoup

Web scraping 使用jsoup从web获取特定元素

web-scraping

Web scraping 使用jsoup从web获取特定元素,web-scraping,jsoup,Web Scraping,Jsoup,我想从这里得到原子钟，我写了这个程序 import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import java.io.*; import java.util.*; public class da { /** * @param args */ public static void main(St

我想从这里得到原子钟，我写了这个程序

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements; 
import java.io.*;
import java.util.*;
public class da {

/**
 * @param args
 */
public static void main(String[] args) {
try{
    Document doc=Jsoup.connect("http://watches.uhrzeit.org/atomic-clock.php").get();
    Elements spans = doc.select("span[id=anzeige_std]");
    System.out.println(spans.text());

    }
    catch(Exception e)
    {
        e.printStackTrace();
    }
}

}

问题是为什么它不打印任何内容（我在这方面不在行，我想学习）。

首先，要根据元素id选择元素，请使用格式

element\id

。您拥有它的方式适用于其他属性

其次，时钟在这个html上：

<div id="timer">
    <div id="timeText">
        <h2>current time CET</h2>
        <div id="anzeige_zeit">22:03:10</div> 
        <div id="anzeige_datum">Tuesday,  2. August 2016</div>
        <div id="anzeige_kw">calendar week 31</div>
    </div>
</div>

输出

22:08:05

至于div#anzeige#zeit中的#代表什么？@User124235#就是我们如何选择id属性。对于其他属性，使用div[attr=value]，例如

22:08:05