Java 在从xml解析的html标记之间提取文本
有人能帮我把html标签中的文本提取成纯文本吗 我已经解析了一个xml,并得到了一些输出作为主体,其中包含html标记。现在我想删除标记并使用文本Java 在从xml解析的html标记之间提取文本,java,html,xml,Java,Html,Xml,有人能帮我把html标签中的文本提取成纯文本吗 我已经解析了一个xml,并得到了一些输出作为主体,其中包含html标记。现在我想删除标记并使用文本 提前感谢 您可以像 比如说 HTML是 试试看 如果HTML被转义,即而不是,考虑到您的需求,您可以尝试 看看课堂: 使用默认设置,源段: “一次//一个脚本” 生成文本“一二三” 如果您只想从字符串中删除HTML标记,则可以执行以下操作: String output = input.replaceAll("(?s)\\<.*?\\>",
提前感谢 您可以像 比如说 HTML是 试试看
如果HTML被转义,即
而不是,考虑到您的需求,您可以尝试
看看课堂:
使用默认设置,源段:
“一次//一个脚本”
生成文本“一二三”
如果您只想从字符串中删除HTML标记,则可以执行以下操作:
String output = input.replaceAll("(?s)\\<.*?\\>", " ");
String output=input.replaceAll(“(?s)\\”,”);
Document document = Jsoup.parse(html);
Element div = document.select("div[style=height:240px;]").first();
div.html();
String output = input.replaceAll("(?s)\\<.*?\\>", " ");