Jsoup 将HTML文件转换为文本文件

Jsoup 将HTML文件转换为文本文件,jsoup,Jsoup,我得到了一个html文件,我需要将它的文本移动到一个新的文本文件,我将创建。我不知道我是否在正确的轨道上。我应该先把它变成一个文档然后再变成一个文本文件吗?我目前所做的正确吗?对不起,我是这方面的初学者,有点困惑 public void parseIntoFile(){ Document docParse = Jsoup.parse("example.html"); } HTML通常用于描述文档,因此它已经是文档了。您的工作将是收集文档中描述的部分,并以您选择的方式将文本文件放在一起。

我得到了一个html文件,我需要将它的文本移动到一个新的文本文件,我将创建。我不知道我是否在正确的轨道上。我应该先把它变成一个文档然后再变成一个文本文件吗?我目前所做的正确吗?对不起,我是这方面的初学者,有点困惑

public void parseIntoFile(){
    Document docParse = Jsoup.parse("example.html");
}

HTML通常用于描述文档,因此它已经是文档了。您的工作将是收集文档中描述的部分,并以您选择的方式将文本文件放在一起。例如,a是页面的标题 包含一段文字等

这在一定程度上是doctype DTD位于顶部的原因。文档类型定义描述文档中每个元素的类型或含义