Python pickle:加载前修复\r字符_Python_Carriage Return_Pickle

Python pickle:加载前修复\r字符

python

Python pickle:加载前修复\r字符,python,carriage-return,pickle,Python,Carriage Return,Pickle,我得到了一个pickle对象（其中包含一些numpy数组的列表），它是在Windows上创建的，显然是保存到一个文件中，作为文本加载，而不是以二进制模式加载（即使用open（filename，'w'）而不是open（filename，'wb'））。结果是，现在我无法取消勾选它（甚至在Windows上），因为它感染了\r字符（可能更多）？主要投诉是 ImportError: No module named multiarray 可能是因为它正在寻找numpy.core.multiarray\r，

我得到了一个pickle对象（其中包含一些numpy数组的列表），它是在Windows上创建的，显然是保存到一个文件中，作为文本加载，而不是以二进制模式加载（即使用

open（filename，'w'）

而不是

open（filename，'wb'）

）。结果是，现在我无法取消勾选它（甚至在Windows上），因为它感染了

\r

字符（可能更多）？主要投诉是

ImportError: No module named multiarray

可能是因为它正在寻找

numpy.core.multiarray\r

，而这当然不存在。简单地删除

\r

字符并没有奏效（在python中，尝试了

sed-e的/\r//g'

和

s=file.read（）.replace（'\r'，''）

，但这两种方法都会破坏文件，并在稍后生成

cPickle.unpickror

）

问题是我真的需要从对象中获取数据。有没有办法修复这些文件

编辑：根据请求，我的文件的前几百个字节，八进制：

\x80\x02]q\x01(}q\x02(U\r\ntotal_timeq\x03G?\x90\x15r\xc9(s\x00U\rreaction_timeq\x04NU\x0ejump_directionq\x05cnumpy.core.multiarray\r\nscalar\r\nq\x06cnumpy\r\ndtype\r\nq\x07U\x02f8K\x00K\x01\x87Rq\x08(K\x03U\x01<NNNJ\xff\xff\xff\xffJ\xff\xff\xff\xffK\x00tbU\x08\x025\x9d\x13\xfc#\xc8?\x86Rq\tU\x14normalised_directionq\r\nh\x06h\x08U\x08\xf0\xf9,\x0eA\x18\xf8?\x86Rq\x0bU\rjump_distanceq\x0ch\x06h\x08U\x08\x13\x14\xea&\xb0\x9b\x1a@\x86Rq\rU\x04jumpq\x0ecnumpy.core.multiarray\r\n_reconstruct\r\nq\x0fcnumpy\r\nndarray\r\nq\x10K\x00\x85U\x01b\x87Rq\x11(K\x01K\x02\x85h\x08\x89U\x10\x87\x16\xdaEG\xf4\xf3?\x06`OC\xe7"\x1a@tbU\x0emovement_speedq\x12h\x06h\x08U\x08\\p\xf5[2\xc2\xef?\x86Rq\x13U\x0ctrial_lengthq\x14G@\t\x98\x87\xf8\x1a\xb4\xbaU\tconditionq\x15U\x0bhigh_mentalq\x16U\x07subjectq\x17K\x02U\x12movement_directionq\x18h\x06h\x08U\x08\xde\x06\xcf\x1c50\xfd?\x86Rq\x19U\x08positionq\x1ah\x0fh\x10K\x00\x85U\x01b\x87Rq\x1b(K\x01K\x02\x85h\x08\x89U\x10K\xb7\xb4\x07q=\x1e\xc0\xf2\xc2YI\xb7U&\xc0tbU\x04typeq\x1ch\x0eU\x08movementq\x1dh\x0fh\x10K\x00\x85U\x01b\x87Rq\x1e(K\x01K\x02\x85h\x08\x89U\x10\xad8\x9c9\x10\xb5\xee\xbf\xffa\xa2hWR\xcf?tbu}q\x1f(h\x03G@\t\xba\xbc\xb8\xad\xc8\x14h\x04G?\xd9\x99%]\xadV\x00h\x05h\x06h\x08U\x08\xe3X\xa9=\xc1\xb1\xeb?\x86Rq h\r\nh\x06h\x08U\x08\x88\xf7\xb9\xc1\t\xd6\xff?\x86Rq!h\x0ch\x06h\x08U\x08v\x7f\xeb\x11\xea5\r@\x86Rq"h\x0eh\x0fh\x10K\x00\x85U\x01b\x87Rq#(K\x01K\x02\x85h\x08\x89U\x10\xcd\xd9\x92\x9a\x94=\x06@]C\xaf\xef\xeb\xef\x02@tbh\x12h\x06h\x08U\x08-\x9c&\x185\xfd\xef?\x86Rq$h\x14G@\r\xb8W\xb2`V\xach\x15h\x16h\x17K\x02h\x18h\x06h\x08U\x08\x8e\x87\xd1\xc2

\x80\x02]q\x01（}q\x02（U\r\ntotal\U timeq\x03G？\x90\x15r\xc9（s\x00U\rreaction\U timeq\x04NU\x0ejump\U directionq\x05cnumpy.core.multiarray\r\nscalar\r\nq\x06cnumpy\r\ndtype\r\r\nq\x07U\x02f8K\x00K\x01\x7rq\x08（K\x03U\x01在Windows上，您不能以文本模式打开文件，与写入文件的方式相同，读入文件，然后将其写入另一个以二进制模式正确打开的文件吗？
您是否尝试过以文本模式取消勾选？也就是说
x = pickle.load(open(filename, 'r'))

（当然是在Windows上。）
假定文件是使用默认协议=0 ASCII兼容方法创建的，您应该能够使用open（'pickled_file'，'rU'）
即通用换行符将其加载到任意位置
如果这不起作用，请显示前几百个字节：print repr（打开（'pickled_file'，'rb'）。读取（200））
并将结果粘贴到问题的编辑中
文件内容发布后更新：
您的文件以'\x80\x02'
开头；它是用最新/最好的协议2转储的。协议1和2是二进制协议。您的文件是在Windows上以文本模式写入的。这导致每个'\n'
都被C运行时转换为'\r\n'
。文件应该在bin中打开像这样的模式：
with open('result.pickle', 'wb') as f: # b for binary
    pickle.dump(obj, f, pickle.HIGHEST_PROTOCOL)

with open('result.pickle', 'rb') as f: # b for binary
    obj = pickle.load(f)

文档是可移植的。此代码可在Windows和非Windows系统上移植
您可以恢复原始pickle映像，方法是以二进制模式读取该文件，然后将所有出现的'\r\n'
替换为'\n'
。注意：无论您是否尝试在Windows上读取，此恢复过程都是必需的。
Windows中的换行符不仅仅是'\r'
，而是CRLF，or'\r\n'

给出file.read（）.replace（'\r\n'，'\n'）
一次尝试。您之前删除的回车可能不是换行符的一部分。
不，显然Windows不喜欢它自己的换行符…？+1：明白了！这在Mac OS X上运行。pickle文件中确实有孤立的\r
字符。太棒了，解决了它！非常感谢，您节省了4个小时我们的工作非常非常昂贵（不，绝对不是因为我的薪水…；-）+1获取关于酸洗协议版本的信息。@Nkosisti，你应该将此标记为答案。如果你在windows上GIT文件，默认情况下，GIT会将“\n”改为“\r\n”，这将导致“任何模块无法加载”错误。在我的情况下（win10，python3.6，atis.pkl from），将atis.pkl+pickle.load（fhandle，encoding='latin1'）中所有出现的'\r\n'替换为'\n'，工作正常。如果我忽略encoding='latin1'，系统将抱怨：UnicodeDecodeError:'ascii'编解码器无法解码位置0中的字节0xe8:序号不在范围内（128）