Encoding 修复iso-8859-1中保存的UTF-8文档中的字符集编码

Encoding 修复iso-8859-1中保存的UTF-8文档中的字符集编码,encoding,utf-8,character-encoding,Encoding,Utf 8,Character Encoding,我需要你的帮助 我有一个大型UTF-8JSON文档,其中一些字符串属性来自ISO-8859-1源代码 这就产生了这个例子: { "id":"3", "name_fr":"Algérie", "name_en":"Algeria" }; ... { "id":"7", "label":"Horizon 2020", "link":"http://www.rennes-metropole.fr/developpement-durable/horizon-2020/hor

我需要你的帮助

我有一个大型UTF-8JSON文档,其中一些字符串属性来自ISO-8859-1源代码

这就产生了这个例子:

{
  "id":"3",
  "name_fr":"Algérie",
  "name_en":"Algeria"
};

...

{
  "id":"7",
  "label":"Horizon 2020",
  "link":"http://www.rennes-metropole.fr/developpement-durable/horizon-2020/horizon-2020-l-exposition.html",
  "comment":"<P ALIGN=\"LEFT\">Lââ¬â¢exposition ë Horizon 2020 û est une promenade dans le Pays de Rennes. Dans cette promenade, vous rencontrez huit étapes qui concernent les principales questions à  l&apos;horizon 2020.</P>",
  "illustration_file_id":"0"
},
{
“id”:“3”,
“姓名”:“Algérie”,
“姓名”:“阿尔及利亚”
};
...
{
“id”:“7”,
“标签”:“地平线2020”,
“链接”:http://www.rennes-metropole.fr/developpement-durable/horizon-2020/horizon-2020-l-exposition.html",
“评论”:“

LÃ、LÃ、Lë地平线2020»这是雷恩的长廊。在塞特长廊,你可以看《地平线2020》的主要问题。

”, 插图文件id:“0” },
考虑到以下情况,是否有任何简单的方法来修复我的文档:

  • 此文档几乎有500KB大
  • 我不能仅仅查找/替换,因为它还包含错误编码的字符,如“«”,后来变成了“ë”
?

我试图用php或javascript来实现这一点,但我对任何解决方案都持开放态度

非常感谢

找到了

刚刚将我的JSON文档转换为PHP文件,然后用以下内容包装:

<?php

$string = <<<EOF
MY huge JSON DOCUMENT
EOF;

echo iconv("UTF-8", "ISO-8859-1", $string);

FYI,“fix”标记用于fix协议,不是因为您需要修复某些东西。您能否添加一些关于原始输入的详细信息,对其执行了哪些操作,以及如何可视化此输出?您看到的是使用预期ISO-8859-1编码的程序查看UTF-8文档时所看到的内容,因此不清楚输出是否有任何问题。原始输入来自FlashFirebug,我使用它从AMF响应获取JSON对象。Firefox/Chrome和Firebug是UTF-8,但服务器和响应是ISO-8859-*。一开始我没有考虑使用iconv(),因为我认为它会更复杂。我尝试使用XML字符集声明、其他AMF客户机(它们都不起作用)和许多其他解决方案。非常感谢您的支持,回答我=)