Java 如何使用JSoup从iFrame标记中的多个表中提取数据
我需要在iframe标记中提取multible表的内容, 我正在使用这个代码Java 如何使用JSoup从iFrame标记中的多个表中提取数据,java,html-table,Java,Html Table,我需要在iframe标记中提取multible表的内容, 我正在使用这个代码 Document doc = Jsoup.connect("http://pubedt.uvsq.fr/VER/g4227.html") .header("User-Agent", "Mozilla/5.0 (X11; Linux x86_64) Gecko/20100101 Firefox/19.0").timeout(100*1000) .get(); for
Document doc = Jsoup.connect("http://pubedt.uvsq.fr/VER/g4227.html")
.header("User-Agent", "Mozilla/5.0 (X11; Linux x86_64) Gecko/20100101 Firefox/19.0").timeout(100*1000)
.get();
for (Element table : doc.select("table")) {
// System.out.println(table.html());
for (Element row : table.select("tr")) {
Elements tds = row.select("td");
if (tds.size() > 6) {
System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
}
}
}
看起来您的思路是正确的,但tds.size()的条目数从未超过6个:
Document doc = Jsoup
.connect("http://pubedt.uvsq.fr/VER/g4227.html")
.header("User-Agent",
"Mozilla/5.0 (X11; Linux x86_64) Gecko/20100101 Firefox/19.0")
.timeout(100 * 1000).get();
for (Element table : doc.select("table")) {
// System.out.println(table.html());
for (Element row : table.select("tr")) {
Elements tds = row.select("td");
// log added here
System.out.println("tds.size(): " + tds.size());
if (tds.size() > 6) {
System.out.println(tds.get(0).text() + ":"
+ tds.get(1).text());
}
}
}
输出:
tds.size(): 6
tds.size(): 1
tds.size(): 1
tds.size(): 1
tds.size(): 0
tds.size(): 1
tds.size(): 1
tds.size(): 1
tds.size(): 1
tds.size(): 1
tds.size(): 0
tds.size(): 1
tds.size(): 1
但是我没有任何结果当我尝试选择iframe时,我在输出Dé中有这个消息;索尔&埃库特;支持内部和外部的干部;gré;s de fichiers XML,oules brankers inté;gré;s sont dé;sactivé;s维列兹利用le lien ci-dessous。当我尝试选择iframe时,我在输出Dé;索尔&埃库特;支持内部和外部的干部;gré;s de fichiers XML,oules brankers inté;gré;s sont dé;sactivé;s威利兹利用者勒连茨·德索斯。我不看输出中ifram的html!!使用firefox firebug插件查看生成了哪些请求,当我将其与您的url一起使用时,我会在第一个请求之后看到一些请求,以获取更多数据,例如:并且,您要查找的数据可能包含在其中