.net 显示奇怪字符的WebClient

.net 显示奇怪字符的WebClient,.net,vb.net,webclient,.net,Vb.net,Webclient,我正在尝试下载此网站: 并过滤掉数据以获得“原始电话公司”,等等,但它显示的是这些数据,而不是应该显示的数据: <p class="lt">Estimated Region:<br /><strong>&#80;&#101;&#110;&#110;&#115;&#121;&#108;&#118;&#97;&#110;&#105;&#97;</strong&g

我正在尝试下载此网站:

并过滤掉数据以获得“原始电话公司”,等等,但它显示的是这些数据,而不是应该显示的数据:

 <p class="lt">Estimated Region:<br /><strong>&#80;&#101;&#110;&#110;&#115;&#121;&#108;&#118;&#97;&#110;&#105;&#97;</strong>

估计区域:80ennsylvania

而不是:

估计地区:宾夕法尼亚州


有没有办法在.NET中修复/转换它?

那就是HTML


您正在查找。

您看到的数据是

我不确定,但可能会成功


如果解码后的内容包含ascii标记,那么您可以只对标记中由ascii字符表示的部分进行WebUtility.HtmlEncode编码。

很有趣,谢谢。出于好奇,如果没有外部库,我绝对无法在.NET中正确执行此操作?@Thomas:如果它是完全有效的XHTML,您可以使用LINQ to XML(
XElement
)。如果您只想处理实体,可以调用
WebUtility.HtmlDecode