在Java中使用Jsoup提取HTML表(span)标记
我试图提取td名称和span类。 在示例代码中,我想提取第一个td“附件”中的a href with和第二个td中的span标记 我想打印 老鼠,是存在的,是的 键盘,没有 双监视器,是否存在 当我使用下面的Java代码时, 老鼠是的 键盘号 双监视器是的 如何获取span类名称? HTML代码在Java中使用Jsoup提取HTML表(span)标记,java,html,html-parsing,jsoup,Java,Html,Html Parsing,Jsoup,我试图提取td名称和span类。 在示例代码中,我想提取第一个td“附件”中的a href with和第二个td中的span标记 我想打印 老鼠,是存在的,是的 键盘,没有 双监视器,是否存在 当我使用下面的Java代码时, 老鼠是的 键盘号 双监视器是的 如何获取span类名称? HTML代码 是 不 是 Java代码 私有void printParse(字符串HTMLdata){ Element table=data.select(“table[class=“co
是
不
是
Java代码
私有void printParse(字符串HTMLdata){
Element table=data.select(“table[class=“computer_table”).first();
迭代器ite=table.select(“td”).Iterator();
while(ite.hasnext()){
sysout(ite.next().text());
}
}
如果您得到table元素,那么您所需要的就是得到span。您不需要得到td,因为您可以使用span进行查询,并且仍然得到相同的结果。下面是代码片段
Elements span = table.select("span");
for (Element src : span) {
if (src.tagName().equals("span"))
System.out.print( src.attr("class") );
}
但要确保您得到了表元素
Element table = doc.select("table[id=computer_table]").first();
元素结果=表格。选择(“td”)
<td class="" width="1%" style="padding:0px;">
</td>
<td class="">
<a href="/accessory">Dual-Monitor</a>
</td>
<td class="tright ">
<span class='is_present'>Yes</span><br/>
</td>
<td class="tright ">
<br/>
</td>
Element table = data.select("table[class="computer_table").first();
Iterator<Element> ite = table.select("td").iterator();
while(ite.hasnext()){
sysout(ite.next().text());
}
}
Elements span = table.select("span");
for (Element src : span) {
if (src.tagName().equals("span"))
System.out.print( src.attr("class") );
}
Element table = doc.select("table[id=computer_table]").first();
for (Element dl : results) {
if(!dl.text().equals("") && dl.text().length() > 1)
pNames.add(dl.text());
if((!dl.select("small").text().equals("")) && dl.select("small").text().length() > 1)
emails.add((dl.select("small").text()));
if(!dl.select("span").attr("class").equals("") && dl.select("span").attr("class").length() > 1)
moneyDollars.add(dl.select("span").attr("class"));
}