.net 显示奇怪字符的WebClient
我正在尝试下载此网站: 并过滤掉数据以获得“原始电话公司”,等等,但它显示的是这些数据,而不是应该显示的数据:.net 显示奇怪字符的WebClient,.net,vb.net,webclient,.net,Vb.net,Webclient,我正在尝试下载此网站: 并过滤掉数据以获得“原始电话公司”,等等,但它显示的是这些数据,而不是应该显示的数据: <p class="lt">Estimated Region:<br /><strong>Pennsylvania</strong&g
<p class="lt">Estimated Region:<br /><strong>Pennsylvania</strong>
估计区域:80ennsylvania强>
而不是:
估计地区:宾夕法尼亚州
有没有办法在.NET中修复/转换它?那就是HTML
您正在查找。您看到的数据是 我不确定,但可能会成功
如果解码后的内容包含ascii标记,那么您可以只对标记中由ascii字符表示的部分进行WebUtility.HtmlEncode编码。很有趣,谢谢。出于好奇,如果没有外部库,我绝对无法在.NET中正确执行此操作?@Thomas:如果它是完全有效的XHTML,您可以使用LINQ to XML(
XElement
)。如果您只想处理实体,可以调用WebUtility.HtmlDecode
。