Java消除html字符串中不允许的字符
我面临着一个非常困难的问题,这是: 我有许多HTML格式的字符串。它们是由文档元素生成的,其中文本用RTF编辑并保存在HTML中(以便在网站上显示) 现在的问题是,一些解析为HTML的RTF元素在HTML中似乎不可用,这导致它崩溃。html中不允许的字符之一是%0b 据我所知,它没有任何功能,或者我不明白为什么需要它(事实上,它甚至不可复制) 我现在的问题是:是否有一个函数(我已经搜索过)能够消除这种格式化rtf2html字符串的所有非html字符Java消除html字符串中不允许的字符,java,html,character-encoding,rtf,Java,Html,Character Encoding,Rtf,我面临着一个非常困难的问题,这是: 我有许多HTML格式的字符串。它们是由文档元素生成的,其中文本用RTF编辑并保存在HTML中(以便在网站上显示) 现在的问题是,一些解析为HTML的RTF元素在HTML中似乎不可用,这导致它崩溃。html中不允许的字符之一是%0b 据我所知,它没有任何功能,或者我不明白为什么需要它(事实上,它甚至不可复制) 我现在的问题是:是否有一个函数(我已经搜索过)能够消除这种格式化rtf2html字符串的所有非html字符 我只需要在加载html时消除它们,这样就不会有
我只需要在加载html时消除它们,这样就不会有任何显示问题使用Apache Commons Lang提供的方法
import org.apache.commons.lang.StringEscapeUtils;
String afterDecoding = StringEscapeUtils.unescapeHtml(beforeDecoding);
归功于:@jlordo
或者您可以使用
replaceAll(“%0b”和“”)代码>来自“崩溃”的确切错误消息是什么?你也可以发布你的HTML的相关片段和标题(带有编码信息)。你能举个例子吗?