Encoding 在Unix中将ASCII转换为BIG5编码

Encoding 在Unix中将ASCII转换为BIG5编码,encoding,character-encoding,ascii,big5,Encoding,Character Encoding,Ascii,Big5,我们能把ASCII码改成BIG5码吗 实际上,我必须从ASCII格式生成一个BIG5格式的文件,但我找不到改变文件编码的方法。我在这里创建的文件包含不以ASCII格式显示的中文数据,并且只能以BIG5格式显示。因此,创建ASCII文件后,我需要将其转换为BIG5格式。这就是为什么我需要它转换成BIG5 我不知道ASCII编码的文件如何包含中文数据,但如果可能,这将是命令: iconv-f ASCII-t BIG5 ascififile-o big5file.txt 它会将您的ASCII编码文件转

我们能把ASCII码改成BIG5码吗


实际上,我必须从ASCII格式生成一个BIG5格式的文件,但我找不到改变文件编码的方法。我在这里创建的文件包含不以ASCII格式显示的中文数据,并且只能以BIG5格式显示。因此,创建ASCII文件后,我需要将其转换为BIG5格式。这就是为什么我需要它转换成BIG5

我不知道ASCII编码的文件如何包含中文数据,但如果可能,这将是命令:

iconv-f ASCII-t BIG5 ascififile-o big5file.txt

它会将您的ASCII编码文件转换为BIG5,并将输出写入
big5file.txt

但最有可能的是,原始文件中没有ASCII码。确保检测到准确的编码,然后在命令中使用它。使用
iconv-l
查看所有可用编码

您可以尝试使用或找出真正的编码。如果您的终端不可用,您可以使用
pip install chardet
(或
pip install cchardet
)安装它

安装后,将文件名作为第一个参数传递:

 chardet Tian.Jiang.Xiong.Shi.srt 
      >>> Tian.Jiang.Xiong.Shi.srt: GB2312 with confidence 0.99
如果使用pip3安装,则脚本名称将为chardet3chardetect3


这个问题很有用。ASCII文件包含什么?请举例说明。如果文件包含以拉丁字母转录的中文(使用拼音或韦德-吉尔斯),那么它与字符编码转换完全不同。将抄写的中文改写成正常的中文“表意文字”(汉字)相当复杂,因为同一个抄写的单词可能对应许多不同的中文单词。@user1929959:谢谢,但这个问题有点不同。。在我的例子中,我想将一个文件从ASCII转换为BIG5..@JukkaK.Korpela:我的文件中有一些繁体中文用于eg。“松大道 " 这些角色……”松大道 “不能用Ascii编写。Ascii是一种7位编码,只有128个代码位置,用于控制字符、基本拉丁字母、常用数字和少量其他字符。谢谢,我将文件从Ascii转换为BIG5,但为什么中文字符显示为”?????“.我真的无法理解这件事.如果你明白了???”????这意味着实际编码实际上不是ASCII码,而是其他编码。您需要找出实际的编码是什么,例如使用以下一些工具:@JukkaK.Korpela:答案被接受,因为它确实根据文件大小将BIG5转换为ASCII,字符不会显示,因为它不能在ASCII中表示中文字符。@ccpizza:我确信该文件是ASCII,因为在我编写文件时,我在参数中明确指定了ASCII编码数据将用于编写文件。但是你提供的链接也很有帮助。。谢谢