Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/384.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 将XHTML转换为纯文本_Java_Text_Xhtml - Fatal编程技术网

Java 将XHTML转换为纯文本

Java 将XHTML转换为纯文本,java,text,xhtml,Java,Text,Xhtml,有没有一种方法可以使用Java将XHTML转换为纯文本 有谁能指导我吗?如果您想从XHTML结构中提取特殊数据,请尝试。它提供了类似jquery的方法来提取和操作XHTML。您可以迭代所有HTMLDOM元素并获取文本属性 或者,如果要删除html标记并仅保留文本,请尝试使用正则表达式。看看这个。您必须编写一些代码。XHTML到纯文本的确切含义是什么?XHTML已经是纯文本文件。尝试在编辑器(记事本)中打开。你的意思是移除所有标签吗?请提供更多信息假设我有下面的XHTML,从中我需要提取“标题”和

有没有一种方法可以使用Java将XHTML转换为纯文本


有谁能指导我吗?

如果您想从XHTML结构中提取特殊数据,请尝试。它提供了类似jquery的方法来提取和操作XHTML。您可以迭代所有HTMLDOM元素并获取文本属性


或者,如果要删除html标记并仅保留文本,请尝试使用正则表达式。看看这个。

您必须编写一些代码。XHTML到纯文本的确切含义是什么?XHTML已经是纯文本文件。尝试在编辑器(记事本)中打开。你的意思是移除所有标签吗?请提供更多信息假设我有下面的XHTML,从中我需要提取“标题”和“正文”作为纯文本,有没有一种方法可以使用Java/Unix脚本来做到这一点。文档页面标题来源这是一个测试页面