C# 一个Windows-1252编码的XML中重音符号的字符错误

C# 一个Windows-1252编码的XML中重音符号的字符错误,c#,.net,xml,C#,.net,Xml,在我需要用C#读取的XML中,我找到了如下字符 据我所知,我不应该在windows-1252编码的XML中找到这些字符。我可以用C#解决这个问题吗?或者XML本身必须更新 提前感谢。简单的答案是:您可能使用了错误的编码。因此,我认为您应该使用UTF-8。您可以通过在解析文档之前下载文档来强制执行它 我应该注意到,下载URL很棘手:web服务器经常报告错误的编码。这也是HTML5标准包含编码检测部分的原因。恐怕没有简单的通用解决方案——我们最终为我们的网络爬虫实现了自己的编码检测算法。简单的答案

在我需要用C#读取的XML中,我找到了如下字符

据我所知,我不应该在windows-1252编码的XML中找到这些字符。我可以用C#解决这个问题吗?或者XML本身必须更新


提前感谢。

简单的答案是:您可能使用了错误的编码。因此,我认为您应该使用UTF-8。您可以通过在解析文档之前下载文档来强制执行它


我应该注意到,下载URL很棘手:web服务器经常报告错误的编码。这也是HTML5标准包含编码检测部分的原因。恐怕没有简单的通用解决方案——我们最终为我们的网络爬虫实现了自己的编码检测算法。

简单的答案是:您可能使用了错误的编码。因此,我认为您应该使用UTF-8。您可以通过在解析文档之前下载文档来强制执行它


我应该注意到,下载URL很棘手:web服务器经常报告错误的编码。这也是HTML5标准包含编码检测部分的原因。恐怕没有简单的通用解决方案——我们最终为我们的网络爬虫实现了自己的编码检测算法。

看起来XML确实需要更新


您当然可以编写一些东西,将其读入为UTF-8,然后将其写回它声称的Windows-1252,但为什么要这么麻烦呢?Windows-1252中的XML就像一个人在文艺复兴集市上穿着旧骑士的衣服使用智能手机一样。只要从第一行删除不正确的声明就可以了。

看起来XML确实需要更新


您当然可以编写一些东西,将其读入为UTF-8,然后将其写回它声称的Windows-1252,但为什么要这么麻烦呢?Windows-1252中的XML就像一个人在文艺复兴集市上穿着旧骑士的衣服使用智能手机一样。只要从第一行删除不正确的声明,就可以了。

这是UTF8,而不是Windows-1252。准确地说,这是UTF8,而不是Windows-1252。准确地说
é,É