Java HTML特殊字符解析

Java HTML特殊字符解析,java,html,html-parsing,web-scraping,Java,Html,Html Parsing,Web Scraping,我正在寻找一个java类来解析所有HTML特殊字符。 我想这是一个常见的问题,但我现在找不到快速的解决方案 我想得到的是: input: thè --> output: thè input: » input: &lraquo; ... 你知道对我有用的东西吗?你在谷歌上搜索过吗?“JavaHTML标记实体解析器”上的第一个链接是 这似乎是你需要的 此外,您可能需要检查javax.swing.JLabel(和另一个swing文本组件)的呈现

我正在寻找一个java类来解析所有HTML特殊字符。 我想这是一个常见的问题,但我现在找不到快速的解决方案

我想得到的是:

input: thè --> output: thè
input: »
input: &lraquo;
...

你知道对我有用的东西吗?

你在谷歌上搜索过吗?“JavaHTML标记实体解析器”上的第一个链接是

这似乎是你需要的


此外,您可能需要检查javax.swing.JLabel(和另一个swing文本组件)的呈现器。

尝试StringEscapeUtils实用程序类。检查文档中的StringEscapeUtils.unescapeHtml()方法

此处的文档:

请在此下载: