Html 利用JSoup从地下采集花粉类型

Html 利用JSoup从地下采集花粉类型,html,web-scraping,jsoup,Html,Web Scraping,Jsoup,我目前正在尝试清理Wunderground的花粉网站(因为他们的API目前不支持花粉数据) doc=Jsoup.connect(“http://www.wunderground.com/DisplayPollen.asp?Zipcode=19104).get(); 对于(int i=0;i

我目前正在尝试清理Wunderground的花粉网站(因为他们的API目前不支持花粉数据)

doc=Jsoup.connect(“http://www.wunderground.com/DisplayPollen.asp?Zipcode=19104).get();
对于(int i=0;i<4;i++)
{
元素级别=文档选择(“td.levels”).get(i);
元素日期=doc.select(“td.text center.偶数四”).get(i);
levelsList.add(levels.text());
datesList.add(dates.text());
}
上面是我用来获取花粉索引的代码,以及它被获取的日期

我目前正在尝试捕获花粉类型,下面是HTML的一个示例

使用
div.panel

Element pollenType=doc.select(“div.panel”).first()

它确实会刮取花粉类型,但也会刮取页面的整个面板,这意味着它捕获的数据比我想要的要多。我只对这个感兴趣:
花粉类型:橡树、桦树和枫树。


我必须捕获哪个分支?或者,我做错了什么?

如果您只对标题的内容感兴趣,可以选择:

doc.select("div.panel h3").first().text()
甚至只是
doc.select(“h3”).first().text()
,当然这不允许任何其他
-标记。
doc.select("div.panel h3").first().text()