C# 转换&;阿林&引用&引用&;ouml&引用;它的正常代表性
我正在加载一个网页C# 转换&;阿林&引用&引用&;ouml&引用;它的正常代表性,c#,character-encoding,html-agility-pack,iso-8859-1,C#,Character Encoding,Html Agility Pack,Iso 8859 1,我正在加载一个网页System.Net.WebClient。页面采用ISO-8859-1编码。 如果我将其写入文件并打开,我可以正常看到所有字符 但是如果我把这个内容放到HtmlAgilityPack中,然后提取innerText属性, 我收到一些特殊的字母,编码为å和ö 如何将它们转换为正常表示?使用该方法 使用该方法 您可以使用文本字符串作为参数调用HtmlEntity.deentize方法 您可以使用文本字符串作为参数调用HtmlEntity.DeEntitize方法 非
System.Net.WebClient
。页面采用ISO-8859-1
编码。
如果我将其写入文件并打开,我可以正常看到所有字符
但是如果我把这个内容放到HtmlAgilityPack中,然后提取innerText属性,
我收到一些特殊的字母,编码为å
和ö代码>
如何将它们转换为正常表示?使用该方法
使用该方法
您可以使用文本字符串作为参数调用HtmlEntity.deentize
方法 您可以使用文本字符串作为参数调用HtmlEntity.DeEntitize
方法 非常感谢您的快速帮助!!正如有人在另一个线程中指出的,这可能是一个问题,因为HttpUtility位于System.Web.dll中,这至少在不包含此程序集的.NET Framework 4客户端配置文件中可能是一个问题。Html敏捷包中包含了HtmlEntity.deentize(参见corvuscorax答案)方法。非常感谢您的快速帮助!!正如有人在另一个线程中指出的,这可能是一个问题,因为HttpUtility位于System.Web.dll中,这至少在不包含此程序集的.NET Framework 4客户端配置文件中可能是一个问题。HTMLAgility包中包含了HtmlEntity.deentize(请参见corvuscorax答案)方法。
HttpUtility.HtmlDecode("å"); // å