Encoding 如何确定文件是否为IBM1047编码
我有一堆XML文件声明为encoding=“IBM1047”,但它们似乎不是:Encoding 如何确定文件是否为IBM1047编码,encoding,xml-parsing,Encoding,Xml Parsing,我有一堆XML文件声明为encoding=“IBM1047”,但它们似乎不是: 当使用iconv将IBM1047转换为UTF-8或ISO8859-1(拉丁语1)时,会产生无法识别的垃圾 文件-我说“未知8位编码” 当由XML解析器解析时,解析器会抱怨序言前有文本,但没有;如果将XML声明中的编码更改为其他内容,则不会发生此错误 找到这些文件的真正编码会很好(我尝试了上面提到的'file-I'和'enca',但仅限于斯拉夫语(文件是法语的)) 我几乎无法控制这些文件是如何产生的;除了找到实际的
- 当使用iconv将IBM1047转换为UTF-8或ISO8859-1(拉丁语1)时,会产生无法识别的垃圾
- 文件-我说“未知8位编码”
- 当由XML解析器解析时,解析器会抱怨序言前有文本,但没有;如果将XML声明中的编码更改为其他内容,则不会发生此错误
- “é”是“)”
- “a”是“ë”
- è是Û
- ê是ª