Java 将XHTML转换为纯文本
有没有一种方法可以使用Java将XHTML转换为纯文本Java 将XHTML转换为纯文本,java,text,xhtml,Java,Text,Xhtml,有没有一种方法可以使用Java将XHTML转换为纯文本 有谁能指导我吗?如果您想从XHTML结构中提取特殊数据,请尝试。它提供了类似jquery的方法来提取和操作XHTML。您可以迭代所有HTMLDOM元素并获取文本属性 或者,如果要删除html标记并仅保留文本,请尝试使用正则表达式。看看这个。您必须编写一些代码。XHTML到纯文本的确切含义是什么?XHTML已经是纯文本文件。尝试在编辑器(记事本)中打开。你的意思是移除所有标签吗?请提供更多信息假设我有下面的XHTML,从中我需要提取“标题”和
有谁能指导我吗?如果您想从XHTML结构中提取特殊数据,请尝试。它提供了类似jquery的方法来提取和操作XHTML。您可以迭代所有HTMLDOM元素并获取文本属性
或者,如果要删除html标记并仅保留文本,请尝试使用正则表达式。看看这个。您必须编写一些代码。XHTML到纯文本的确切含义是什么?XHTML已经是纯文本文件。尝试在编辑器(记事本)中打开。你的意思是移除所有标签吗?请提供更多信息假设我有下面的XHTML,从中我需要提取“标题”和“正文”作为纯文本,有没有一种方法可以使用Java/Unix脚本来做到这一点。文档页面标题来源这是一个测试页面