html字符串中的scala节点

html字符串中的scala节点,scala,jsoup,textnode,Scala,Jsoup,Textnode,我的目标是分析一个“html字符串”。最后我想 提取字符串的Textnodes和datanodes并将其存储在 不同的清单 我第一次尝试递归地遍历“html字符串” import org.jsoup.Jsoup import org.jsoup.nodes.Document import java.util.Iterator import org.jsoup.nodes import org.jsoup.nodes.Node object TextAnalyzer { def pro

我的目标是分析一个“html字符串”。最后我想 提取字符串的Textnodes和datanodes并将其存储在 不同的清单

我第一次尝试递归地遍历“html字符串”

import org.jsoup.Jsoup
import org.jsoup.nodes.Document
import java.util.Iterator
import org.jsoup.nodes
import org.jsoup.nodes.Node

object TextAnalyzer {

    def processNode(node: Node) {
        if (node.isInstanceOf[TextNode]) println(node.toString())
        node.childNodes() foreach processNode
    }

    def main(args: Array[String]) {
        val myHtml = "<html> <head> <title>Welcome</title>    </head>    <body>        <div>            <p>Foo</p>        </div>    </body></html>";

        val doc = Jsoup.parse(myHtml);
        processNode(doc);

    }
}
import org.jsoup.jsoup
导入org.jsoup.nodes.Document
导入java.util.Iterator
导入org.jsoup.nodes
导入org.jsoup.nodes.Node
对象文本分析器{
def processNode(节点:节点){
if(node.isInstanceOf[TextNode])println(node.toString())
node.childNodes()foreach processNode
}
def main(参数:数组[字符串]){
val myHtml=“欢迎Foo

”; val doc=Jsoup.parse(myHtml); 进程节点(doc); } }
它以以下errow消息结束:

scalac MyModule.scala

MyModule.scala:23:错误:value childs不是org.jsoup.nodes.Node的成员 node.childNodes()foreach processNode ^ 发现一个错误 >

你能帮我弄到startet吗 获取文本字符串的数据和文本节点? ... 递归地

提前谢谢你的帮助

问候


Ansgar

我真的不明白你的问题,但下面是我的总结。这是你的目标吗

import org.jsoup.Jsoup
import org.jsoup.nodes.Document
import java.util.Iterator
import org.jsoup.nodes._
import scala.collection.JavaConversions._

    object TextAnalyzer extends App {

        def processNode(node: Node) {
            if (node.isInstanceOf[TextNode]) println(node.toString())
            node.childNodes() foreach processNode
        }

        val myHtml = "<html> <head> <title>Welcome</title>    </head>    <body>        <div>            <p>Foo</p>        </div>    </body></html>";

        val doc = Jsoup.parse(myHtml);
        processNode(doc);

    }
import org.jsoup.jsoup
导入org.jsoup.nodes.Document
导入java.util.Iterator
导入org.jsoup.nodes_
导入scala.collection.JavaConversions_
对象TextAnalyzer扩展应用程序{
def processNode(节点:节点){
if(node.isInstanceOf[TextNode])println(node.toString())
node.childNodes()foreach processNode
}
val myHtml=“欢迎Foo

”; val doc=Jsoup.parse(myHtml); 进程节点(doc); }
Hi selig!这正是我想要的。谢谢!我想我应该专注于一些好的how-to,包括要继承的正确对象(推荐?)。。。干杯,祝你玩得愉快!