Utf 8 修复从UTF8更改为ASCII的文件名

Utf 8 修复从UTF8更改为ASCII的文件名,utf-8,iso-8859-1,mojibake,Utf 8,Iso 8859 1,Mojibake,我最近下载了一组视频,它们的文件名应该是日语字符。相反,谁上传过它们,格式就搞糟了 我得到的不是假名、平假名和汉字 002òòòòòòòòòòòòòòòòòò 我想知道是否有一种方法可以解决这个短的要求另一个上传 我尝试将名称放入一个文本文件,然后对该文件进行十六进制编辑以更改其编码,但没有成功。我将使用Python库作为猜测编码的辅助工具 >>> import chardet >>> s='002òÅü¢âyâbâeâBâôâO(âuâïâ}).mp4' &

我最近下载了一组视频,它们的文件名应该是日语字符。相反,谁上传过它们,格式就搞糟了

我得到的不是假名、平假名和汉字

002òòòòòòòòòòòòòòòòòò

我想知道是否有一种方法可以解决这个短的要求另一个上传

我尝试将名称放入一个文本文件,然后对该文件进行十六进制编辑以更改其编码,但没有成功。

我将使用Python库作为猜测编码的辅助工具

>>> import chardet
>>> s='002òÅü¢âyâbâeâBâôâO(âuâïâ}).mp4'
>>> chardet.detect(s.encode('l1'))
{'encoding': 'ISO-8859-5', 'confidence': 0.536359806931924, 'language': 'Russian'}
>>> chardet.detect(s.encode('cp437'))
{'encoding': 'SHIFT_JIS', 'confidence': 0.99, 'language': 'Japanese'}
>>> chardet.detect(s.encode('cp850'))
{'encoding': 'SHIFT_JIS', 'confidence': 0.99, 'language': 'Japanese'}
可能不是ISO-8859-1,更可能是IBM 437或850

>>> s.encode('cp850').decode('sjis')
'002撫⊃ペッティング(ブルマ).mp4'
>>> s.encode('cp437').decode('sjis')
'002撫○ペッティング(ブルマ).mp4'
可以是其中之一,但我无法读取它们。

我将使用Python库作为猜测编码的辅助工具

>>> import chardet
>>> s='002òÅü¢âyâbâeâBâôâO(âuâïâ}).mp4'
>>> chardet.detect(s.encode('l1'))
{'encoding': 'ISO-8859-5', 'confidence': 0.536359806931924, 'language': 'Russian'}
>>> chardet.detect(s.encode('cp437'))
{'encoding': 'SHIFT_JIS', 'confidence': 0.99, 'language': 'Japanese'}
>>> chardet.detect(s.encode('cp850'))
{'encoding': 'SHIFT_JIS', 'confidence': 0.99, 'language': 'Japanese'}
可能不是ISO-8859-1,更可能是IBM 437或850

>>> s.encode('cp850').decode('sjis')
'002撫⊃ペッティング(ブルマ).mp4'
>>> s.encode('cp437').decode('sjis')
'002撫○ペッティング(ブルマ).mp4'

可以是其中之一,但我无法阅读它们。

我以前从未使用过Python。我做了导入chardet,做了变量赋值。我在chardet(第3行)上得到一个错误,指出“UnicodeDecodeError:'ascii'编解码器无法解码第3位的字节0xc3:序号不在范围(128)”我做错了什么?切换到Python 3。啊,我在控制台上使用Python。是蟒蛇3号。谢谢,现在把它转换成函数形式,制作一个程序,我可以运行这些文件来重命名它们。谢谢你提供的信息。为了记录在案,cp437是正确的代码页,另一个被窃听了75%的时间。我以前从未使用过Python。我做了导入chardet,做了变量赋值。我在chardet(第3行)上得到一个错误,指出“UnicodeDecodeError:'ascii'编解码器无法解码第3位的字节0xc3:序号不在范围(128)”我做错了什么?切换到Python 3。啊,我在控制台上使用Python。是蟒蛇3号。谢谢,现在把它转换成函数形式,制作一个程序,我可以运行这些文件来重命名它们。谢谢你提供的信息。根据记录,cp437是正确的代码页,另一个有75%的时间被窃听。