Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/338.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何使用JSoup从iFrame标记中的多个表中提取数据_Java_Html Table - Fatal编程技术网

Java 如何使用JSoup从iFrame标记中的多个表中提取数据

Java 如何使用JSoup从iFrame标记中的多个表中提取数据,java,html-table,Java,Html Table,我需要在iframe标记中提取multible表的内容, 我正在使用这个代码 Document doc = Jsoup.connect("http://pubedt.uvsq.fr/VER/g4227.html") .header("User-Agent", "Mozilla/5.0 (X11; Linux x86_64) Gecko/20100101 Firefox/19.0").timeout(100*1000) .get(); for

我需要在iframe标记中提取multible表的内容, 我正在使用这个代码

Document doc = Jsoup.connect("http://pubedt.uvsq.fr/VER/g4227.html")
            .header("User-Agent", "Mozilla/5.0 (X11; Linux x86_64) Gecko/20100101 Firefox/19.0").timeout(100*1000)
            .get();
    for (Element table : doc.select("table")) {
    //    System.out.println(table.html());
        for (Element row : table.select("tr")) {
            Elements tds = row.select("td");
            if (tds.size() > 6) {
                System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
            }
        }
    }

看起来您的思路是正确的,但tds.size()的条目数从未超过6个:

Document doc = Jsoup
        .connect("http://pubedt.uvsq.fr/VER/g4227.html")
        .header("User-Agent",
                "Mozilla/5.0 (X11; Linux x86_64) Gecko/20100101 Firefox/19.0")
        .timeout(100 * 1000).get();
for (Element table : doc.select("table")) {
    // System.out.println(table.html());
    for (Element row : table.select("tr")) {
        Elements tds = row.select("td");
        // log added here
        System.out.println("tds.size(): " + tds.size());
        if (tds.size() > 6) {
            System.out.println(tds.get(0).text() + ":"
                    + tds.get(1).text());
        }
    }
}
输出:

tds.size(): 6
tds.size(): 1
tds.size(): 1
tds.size(): 1
tds.size(): 0
tds.size(): 1
tds.size(): 1
tds.size(): 1
tds.size(): 1
tds.size(): 1
tds.size(): 0
tds.size(): 1
tds.size(): 1

但是我没有任何结果当我尝试选择iframe时,我在输出Dé中有这个消息;索尔&埃库特;支持内部和外部的干部;gré;s de fichiers XML,oules brankers inté;gré;s sont dé;sactivé;s维列兹利用le lien ci-dessous。当我尝试选择iframe时,我在输出Dé;索尔&埃库特;支持内部和外部的干部;gré;s de fichiers XML,oules brankers inté;gré;s sont dé;sactivé;s威利兹利用者勒连茨·德索斯。我不看输出中ifram的html!!使用firefox firebug插件查看生成了哪些请求,当我将其与您的url一起使用时,我会在第一个请求之后看到一些请求,以获取更多数据,例如:并且,您要查找的数据可能包含在其中