Html 利用JSoup从地下采集花粉类型_Html_Web Scraping_Jsoup

Html 利用JSoup从地下采集花粉类型

html web-scraping

Html 利用JSoup从地下采集花粉类型,html,web-scraping,jsoup,Html,Web Scraping,Jsoup,我目前正在尝试清理Wunderground的花粉网站（因为他们的API目前不支持花粉数据） doc=Jsoup.connect（“http://www.wunderground.com/DisplayPollen.asp?Zipcode=19104）.get（）；对于（int i=0；i

我目前正在尝试清理Wunderground的花粉网站（因为他们的API目前不支持花粉数据）

doc=Jsoup.connect（“http://www.wunderground.com/DisplayPollen.asp?Zipcode=19104）.get（）；
对于（int i=0；i<4；i++）
{
元素级别=文档选择（“td.levels”）.get（i）；
元素日期=doc.select（“td.text center.偶数四”）.get（i）；
levelsList.add（levels.text（））；
datesList.add（dates.text（））；
}

上面是我用来获取花粉索引的代码，以及它被获取的日期

我目前正在尝试捕获花粉类型，下面是HTML的一个示例

使用

div.panel

：

Element pollenType=doc.select（“div.panel”）.first（）
它确实会刮取花粉类型，但也会刮取页面的整个面板，这意味着它捕获的数据比我想要的要多。我只对这个感兴趣：花粉类型：橡树、桦树和枫树。

我必须捕获哪个分支？或者，我做错了什么？
如果您只对标题的内容感兴趣，可以选择：
doc.select("div.panel h3").first().text()

甚至只是doc.select（“h3”）.first（）.text（）
，当然这不允许任何其他-标记。
doc.select("div.panel h3").first().text()