Java 如何解码HTML实体(“ntilde”、“eacute”…)
假设我有这段文字:Java 如何解码HTML实体(“ntilde”、“eacute”…),java,html,Java,Html,假设我有这段文字: Spain translates to España in spanish. é is é í is í 是否有任何java方法或第三方库可以读取这样的文本并转换所有的&--到它对应的字符中 或者,唯一的方法是创建一个包含所有&--及其对应的值?这不是UTF8编码,它被称为HTML实体。这些值来自哪里?你是从一个HTML文件中解析它们的吗?答案是这个线程:该线程@AthagonYago linked中可能存在
Spain translates to España in spanish.
é is é
í is í
是否有任何java方法或第三方库可以读取这样的文本并转换所有的&--编码>到它对应的字符中
或者,唯一的方法是创建一个包含所有&--代码>及其对应的值?这不是UTF8编码,它被称为HTML实体。这些值来自哪里?你是从一个HTML文件中解析它们的吗?答案是这个线程:该线程@AthagonYago linked中可能存在重复的Watchout,接受的答案不是最好的答案。第二个答案是关于使用Jsoup库,这可能是解决问题的最佳方法!