如何在Python中高效地将二进制文件作为字符串读取?
我试图读取一个文件,并通过一个数据冗余和加密算法传递它,该算法采用字符串。如何正确地将此文件作为字符串读取。我需要一个编码格式,映射到所有字符位置,因为这些是原始二进制字节。到目前为止,我已经尝试了被称为“cp866”的编码格式,但是每当我使用这种编码格式时,它从文件中读取的速度非常非常慢 如何像UNIX cat命令或Windows type命令那样以字符串形式读取文件 这是我的档案如何在Python中高效地将二进制文件作为字符串读取?,python,optimization,file-io,character-encoding,cat,Python,Optimization,File Io,Character Encoding,Cat,我试图读取一个文件,并通过一个数据冗余和加密算法传递它,该算法采用字符串。如何正确地将此文件作为字符串读取。我需要一个编码格式,映射到所有字符位置,因为这些是原始二进制字节。到目前为止,我已经尝试了被称为“cp866”的编码格式,但是每当我使用这种编码格式时,它从文件中读取的速度非常非常慢 如何像UNIX cat命令或Windows type命令那样以字符串形式读取文件 这是我的档案 character_encoding = 'cp866' with open(r'Insert_Your_La
character_encoding = 'cp866'
with open(r'Insert_Your_Large_Binary_File_Here',
encoding=character_encoding) as file:
text = file.read()
print(text)
如何加快此函数的速度或更好地复制cat和type命令生成的字符串
如何将数据打印到标准输出?印刷品是否足够?
本质上,我正在寻找跨平台的Python脚本来复制这些数据
这是我上一篇文章的延伸
如果您能为我提供任何帮助或指导合适的Python软件包,我将不胜感激
更新:当我没有指定编码时,会出现以下错误:
回溯(最近一次呼叫最后一次):
文件“文件名\u已编辑”,第13行,在
text=file.read()
文件“C:\Python34\lib\encodings\cp1252.py”,第23行,解码
返回编解码器.charmap\u解码(输入、自身错误、解码表)[0]
UnicodeDecodeError:“charmap”编解码器无法解码位置34中的字节0x90:字符映射到
基于此,看起来我应该使用这种古老的MSDOS编码。真的没有更好的办法吗 您是否尝试过将open(“filename.txt”、“rb”)作为文件:?是否尝试过将open(“filename.txt”、“rb”)作为文件:?