Java 在从xml解析的html标记之间提取文本_Java_Html_Xml

Java 在从xml解析的html标记之间提取文本

java html xml

Java 在从xml解析的html标记之间提取文本,java,html,xml,Java,Html,Xml,有人能帮我把html标签中的文本提取成纯文本吗我已经解析了一个xml，并得到了一些输出作为主体，其中包含html标记。现在我想删除标记并使用文本提前感谢您可以像比如说 HTML是试试看如果HTML被转义，即而不是，考虑到您的需求，您可以尝试看看课堂：使用默认设置，源段： “一次//一个脚本” 生成文本“一二三” 如果您只想从字符串中删除HTML标记，则可以执行以下操作： String output = input.replaceAll("(?s)\\<.*?\\>",

有人能帮我把html标签中的文本提取成纯文本吗

我已经解析了一个xml，并得到了一些输出作为主体，其中包含html标记。现在我想删除标记并使用文本

提前感谢

您可以像

比如说 HTML是

试试看

如果HTML被转义，即

而不是

，考虑到您的需求，您可以尝试
看看课堂：
使用默认设置，源段：
“一次//一个脚本”
生成文本“一二三”
 如果您只想从字符串中删除HTML标记，则可以执行以下操作：
String output = input.replaceAll("(?s)\\<.*?\\>", " ");

String output=input.replaceAll（“（？s）\\”，”）；

Document document = Jsoup.parse(html);
Element div = document.select("div[style=height:240px;]").first();
div.html();

String output = input.replaceAll("(?s)\\<.*?\\>", " ");