Java 有没有快速识别字符串或文本视图中HTML ASCII代码的方法?
以下是一些HTML ASCII代码: 我有一个字符串,可能看起来像是“一天的辛苦工作”Java 有没有快速识别字符串或文本视图中HTML ASCII代码的方法?,java,android,regex,string,ascii,Java,Android,Regex,String,Ascii,以下是一些HTML ASCII代码: 我有一个字符串,可能看起来像是“一天的辛苦工作” 用撇号替换ascii代码的最佳方法是什么?用于解码字符串。使用Apache的StringEscapeUtils.escapeHtml(string)或StringEscapeUtils.unescapeHtml(string)。这可以在commons库中找到 如果您需要保留任何HTML标记,但只是删除任何ascii编码,那么您必须构建一个要转义的值的映射。这是一个String操作的练习,因此它可能被认为是一
用撇号替换ascii代码的最佳方法是什么?用于解码字符串。使用Apache的
StringEscapeUtils.escapeHtml(string)
或StringEscapeUtils.unescapeHtml(string)
。这可以在commons库中找到
如果您需要保留任何HTML标记,但只是删除任何ascii编码,那么您必须构建一个要转义的值的映射。这是一个String
操作的练习,因此它可能被认为是一个“丑陋的黑客”,但它会运行得很快
例如,使用一些伪代码,
创建一个映射()
,并用要替换为键的值和要替换为的值填充它。
使用正则表达式在文档中查找HTML ascii代码,
在替换的映射中查找ascii代码
将出现的HTML ascii代码替换为等效文本
如果有机会,我会在周末发布一些代码。可能会。问题是这是否会是个问题。我只是删除了我的答案而代之以你的。事实证明,在Android中解析HTML并不像我想象的那么容易(因为它依赖于外部库,就我所知)。无论如何,这种方法似乎更容易处理。下载commons-lang3,然后下载2。字符串s=StringEscapeUtils.escapeHtml4(字符串);