Java 将一行HTML文件划分为格式良好的HTML文件

Java 将一行HTML文件划分为格式良好的HTML文件,java,html,parsing,Java,Html,Parsing,我有一个HTML文件,其中所有标记都在一行中。我想分开每个标签,并把它放在自己的行。最终目标是拥有一个格式良好的HTML文件 e、 g StackOverflow 将转换为: <html> <head> <title> StackOverflow </title> </head> <body> </body> </html>

我有一个HTML文件,其中所有标记都在一行中。我想分开每个标签,并把它放在自己的行。最终目标是拥有一个格式良好的HTML文件

e、 g

StackOverflow

将转换为:

<html>
    <head>
        <title>
        StackOverflow
        </title>
    </head>
    <body>
    </body>
</html>

堆栈溢出

现有的Java库是否已经处理了这个问题?

您的问题与格式良好的HTML文件无关。即使html标记在同一行上,也不意味着html格式不好。 您实际上需要的只是一个格式化程序,它基本上会使您的html更具可读性。
您可以看一看,它还可以选择性地执行语法检查。

jsoup应该可以很好地完成这项工作。如果您想格式化代码,macromedia dreamweaver很适合这样做?将其复制到eclipse或任何ide中。但是我有10000多个文件,所以我认为不可能手动完成。注意,像这样漂亮的打印可以改变它的显示方式。特别是如果在以前没有空白的地方注入空白。我真的希望每个标记都在单独的行中,就是这样!!