Java 将一行HTML文件划分为格式良好的HTML文件
我有一个HTML文件,其中所有标记都在一行中。我想分开每个标签,并把它放在自己的行。最终目标是拥有一个格式良好的HTML文件 e、 gJava 将一行HTML文件划分为格式良好的HTML文件,java,html,parsing,Java,Html,Parsing,我有一个HTML文件,其中所有标记都在一行中。我想分开每个标签,并把它放在自己的行。最终目标是拥有一个格式良好的HTML文件 e、 g StackOverflow 将转换为: <html> <head> <title> StackOverflow </title> </head> <body> </body> </html>
StackOverflow
将转换为:
<html>
<head>
<title>
StackOverflow
</title>
</head>
<body>
</body>
</html>
堆栈溢出
现有的Java库是否已经处理了这个问题?您的问题与格式良好的HTML文件无关。即使html标记在同一行上,也不意味着html格式不好。 您实际上需要的只是一个格式化程序,它基本上会使您的html更具可读性。
您可以看一看,它还可以选择性地执行语法检查。jsoup应该可以很好地完成这项工作。如果您想格式化代码,macromedia dreamweaver很适合这样做?将其复制到eclipse或任何ide中。但是我有10000多个文件,所以我认为不可能手动完成。注意,像这样漂亮的打印可以改变它的显示方式。特别是如果在以前没有空白的地方注入空白。我真的希望每个标记都在单独的行中,就是这样!!