如何在SAS7BDAT导入Python后修复捷克语字符

如何在SAS7BDAT导入Python后修复捷克语字符,python,pandas,encoding,sas,Python,Pandas,Encoding,Sas,我需要将sas7bdat文件导入Python。数据的一列是包含捷克语单词的字符串。如果我尝试导入它,捷克语字母就会丢失 我已经试过使用熊猫pd.read_sas。然而,我在不同的列中有大日期,pd.read_sas得到了错误描述(然而,SAS7BDAT可以使用大日期)。下面我复制了一个缩减数据的示例(仅一行一列数据集) 尝试添加encoding='utf-8',如中所示 df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat', encoding='utf-8').t

我需要将sas7bdat文件导入Python。数据的一列是包含捷克语单词的字符串。如果我尝试导入它,捷克语字母就会丢失

我已经试过使用熊猫pd.read_sas。然而,我在不同的列中有大日期,pd.read_sas得到了错误描述(然而,SAS7BDAT可以使用大日期)。下面我复制了一个缩减数据的示例(仅一行一列数据集)


尝试添加
encoding='utf-8'
,如中所示

df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat', encoding='utf-8').to_data_frame()

如果这也不起作用,请尝试找到输入的确切编码。例如,
encoding='iso-8859-1'

谢谢,它起作用了。我使用proc contents data=ddd24;跑在SAS中获取所需的编码。
df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat', encoding='utf-8').to_data_frame()