Encoding 如何拍摄mojibake并找出原始角色集是什么?

Encoding 如何拍摄mojibake并找出原始角色集是什么?,encoding,utf-8,mojibake,Encoding,Utf 8,Mojibake,我有一些数据是有效的UTF-8。然而,它的一部分虽然仍然有效,但显然不是最初的UTF-8。它们也不是UTF-8编码的拉丁语-1 如何确定这些部分的原始字符集,以便恢复有用的信息?或者我应该简单地将它们丢弃为已损坏?有mojibake转换器。一个开源选项是: gem install mojibake require 'mojibake' mapper = MojiBake::Mapper.new mapper.recover( '“quotedâ€�' ) #=> '“quoted”'

我有一些数据是有效的UTF-8。然而,它的一部分虽然仍然有效,但显然不是最初的UTF-8。它们也不是UTF-8编码的拉丁语-1


如何确定这些部分的原始字符集,以便恢复有用的信息?或者我应该简单地将它们丢弃为已损坏?

有mojibake转换器。一个开源选项是:

gem install mojibake
require 'mojibake'
mapper = MojiBake::Mapper.new
mapper.recover( '“quotedâ€�' ) #=> '“quoted”'