Python UnicodeEncodeError:&x27;charmap';编解码器可以';t编码字符'\x85和x27;在位置102:字符映射到<;未定义>;

Python UnicodeEncodeError:&x27;charmap';编解码器可以';t编码字符'\x85和x27;在位置102:字符映射到<;未定义>;,python,arrays,pandas,numpy,Python,Arrays,Pandas,Numpy,我试图将数组保存在文本文件中,但遇到了一个Unicode错误 df_duplicate = df[df['is_duplicate'] == 1] dfp_nonduplicate = df[df['is_duplicate'] == 0] # Converting 2d array of q1 and q2 and flatten the array: like {{1,2},{3,4}} to {1,2,3,4} p = np.dstack([df_duplicate["question1

我试图将数组保存在文本文件中,但遇到了一个Unicode错误

df_duplicate = df[df['is_duplicate'] == 1]
dfp_nonduplicate = df[df['is_duplicate'] == 0]

# Converting 2d array of q1 and q2 and flatten the array: like {{1,2},{3,4}} to {1,2,3,4}
p = np.dstack([df_duplicate["question1"], df_duplicate["question2"]]).flatten()
n = np.dstack([dfp_nonduplicate["question1"], dfp_nonduplicate["question2"]]).flatten()

print ("Number of data points in class 1 (duplicate pairs) :",len(p))
print ("Number of data points in class 0 (non duplicate pairs) :",len(n))

#Saving the np array into a text file
np.savetxt('train_p.txt', p, delimiter=' ', fmt='%s')
np.savetxt('train_n.txt', n, delimiter=' ', fmt='%s')`
我知道我需要将其更改为utf-8格式,但如何处理此特定代码我无法理解。
仍然是python的初学者,我通过将
np.savetxt
放入搜索引擎找到了该文档:

numpy.savetxt(fname, X, fmt='%.18e', delimiter=' ', newline='n', header='', footer='', comments='# ', encoding=None)
    Save an array to a text file.
因此,是的,它确实有一个
编码
参数。这就是指定文件编码的地方。因此:

np.savetxt('train_p.txt', p, delimiter=' ', fmt='%s', encoding='utf-8')

上面写着:这个字符在你的文本中是一个非常奇怪的字符。查看您的数据来自何处会有帮助。

是否
savetxt
encoding
参数?不,我不这么认为。您为什么这么认为?检查文档了吗?尝试添加utf-8和unicode新错误。“NameError:name'Unicode'未定义一切仍然相同错误,我所做的一切都无法解决此问题。请帮助。是的,这确实解决了问题,数据来自kaggle。感谢您的帮助。”。