如何使用Scala迭代Jsoup中的元素?

如何使用Scala迭代Jsoup中的元素?,scala,web-crawler,Scala,Web Crawler,如何使用Scala迭代Jsoup中的元素 我试图实现从网页中提取所有链接,但我不知道如何在Scala中实现。在选择包含整个页面内容的主div元素后,提取所有锚定标记并遍历每个锚定标记并获取其链接(href)值 使用scala.collection.JavaConverters.asScala,因为您将能够map,foreach import scala.collection.JavaConverters._ val document = Jsoup.parse(html) val links =

如何使用Scala迭代Jsoup中的元素


我试图实现从网页中提取所有链接,但我不知道如何在Scala中实现。

在选择包含整个页面内容的主div元素后,提取所有锚定标记并遍历每个锚定标记并获取其链接(href)值


使用
scala.collection.JavaConverters.asScala
,因为您将能够
map
foreach

import scala.collection.JavaConverters._
val document = Jsoup.parse(html)
val links = document.select("a").asScala

links.map { 
    link => //logic
}

我尝试将元素转换成迭代器,并对其进行迭代。现在可以了。现在我想知道我怎么能省略到图像的链接。我只想链接到html页面
import scala.collection.JavaConverters._
val document = Jsoup.parse(html)
val links = document.select("a").asScala

links.map { 
    link => //logic
}