如何在SAS7BDAT导入Python后修复捷克语字符_Python_Pandas_Encoding_Sas

如何在SAS7BDAT导入Python后修复捷克语字符

python pandas encoding sas

如何在SAS7BDAT导入Python后修复捷克语字符,python,pandas,encoding,sas,Python,Pandas,Encoding,Sas,我需要将sas7bdat文件导入Python。数据的一列是包含捷克语单词的字符串。如果我尝试导入它，捷克语字母就会丢失我已经试过使用熊猫pd.read_sas。然而，我在不同的列中有大日期，pd.read_sas得到了错误描述（然而，SAS7BDAT可以使用大日期）。下面我复制了一个缩减数据的示例（仅一行一列数据集）尝试添加encoding='utf-8'，如中所示 df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat', encoding='utf-8').t

我需要将sas7bdat文件导入Python。数据的一列是包含捷克语单词的字符串。如果我尝试导入它，捷克语字母就会丢失

我已经试过使用熊猫pd.read_sas。然而，我在不同的列中有大日期，pd.read_sas得到了错误描述（然而，SAS7BDAT可以使用大日期）。下面我复制了一个缩减数据的示例（仅一行一列数据集）

尝试添加

encoding='utf-8'

，如中所示

df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat', encoding='utf-8').to_data_frame()

如果这也不起作用，请尝试找到输入的确切编码。例如，

encoding='iso-8859-1'

谢谢，它起作用了。我使用proc contents data=ddd24；跑在SAS中获取所需的编码。

df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat', encoding='utf-8').to_data_frame()