如何使用Scala迭代Jsoup中的元素?
如何使用Scala迭代Jsoup中的元素如何使用Scala迭代Jsoup中的元素?,scala,web-crawler,Scala,Web Crawler,如何使用Scala迭代Jsoup中的元素 我试图实现从网页中提取所有链接,但我不知道如何在Scala中实现。在选择包含整个页面内容的主div元素后,提取所有锚定标记并遍历每个锚定标记并获取其链接(href)值 使用scala.collection.JavaConverters.asScala,因为您将能够map,foreach import scala.collection.JavaConverters._ val document = Jsoup.parse(html) val links =
我试图实现从网页中提取所有链接,但我不知道如何在Scala中实现。在选择包含整个页面内容的主div元素后,提取所有锚定标记并遍历每个锚定标记并获取其链接(href)值
使用
scala.collection.JavaConverters.asScala
,因为您将能够map
,foreach
import scala.collection.JavaConverters._
val document = Jsoup.parse(html)
val links = document.select("a").asScala
links.map {
link => //logic
}
我尝试将元素转换成迭代器,并对其进行迭代。现在可以了。现在我想知道我怎么能省略到图像的链接。我只想链接到html页面
import scala.collection.JavaConverters._
val document = Jsoup.parse(html)
val links = document.select("a").asScala
links.map {
link => //logic
}