Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/371.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 在从xml解析的html标记之间提取文本_Java_Html_Xml - Fatal编程技术网

Java 在从xml解析的html标记之间提取文本

Java 在从xml解析的html标记之间提取文本,java,html,xml,Java,Html,Xml,有人能帮我把html标签中的文本提取成纯文本吗 我已经解析了一个xml,并得到了一些输出作为主体,其中包含html标记。现在我想删除标记并使用文本 提前感谢 您可以像 比如说 HTML是 试试看 如果HTML被转义,即而不是,考虑到您的需求,您可以尝试 看看课堂: 使用默认设置,源段: “一次//一个脚本” 生成文本“一二三” 如果您只想从字符串中删除HTML标记,则可以执行以下操作: String output = input.replaceAll("(?s)\\<.*?\\>",

有人能帮我把html标签中的文本提取成纯文本吗

我已经解析了一个xml,并得到了一些输出作为主体,其中包含html标记。现在我想删除标记并使用文本


提前感谢

您可以像

比如说 HTML是

试试看


如果HTML被转义,即
而不是
,考虑到您的需求,您可以尝试

看看课堂:

使用默认设置,源段:
“一次//一个脚本”

生成文本“一二三”

如果您只想从字符串中删除HTML标记,则可以执行以下操作:

String output = input.replaceAll("(?s)\\<.*?\\>", " ");
String output=input.replaceAll(“(?s)\\”,”);
Document document = Jsoup.parse(html);
Element div = document.select("div[style=height:240px;]").first();
div.html();
String output = input.replaceAll("(?s)\\<.*?\\>", " ");