Python 尝试使用pandas从csv文件读取印地语文本时出现编码错误

Python 尝试使用pandas从csv文件读取印地语文本时出现编码错误,python,pandas,csv,hindi,Python,Pandas,Csv,Hindi,我正在尝试使用pandas从csv文件中读取Devanagari文本。使用encoding=“utf-8”时,我遇到一个错误。当我更改encoding=“latin1”时,得到的是NaN值 如果有人已经遇到类似问题或知道如何解决,请提供帮助 提前谢谢 以下是我得到的错误: UnicodeDecodeError:“utf-8”编解码器无法解码位置中的字节0x92 31:起始字节无效 您可以在文本编辑器(如记事本+)中打开该文件并查看编码。它可能是其他东西,例如UCS2。或者在线使用此选项,您需要了

我正在尝试使用pandas从csv文件中读取Devanagari文本。使用
encoding=“utf-8”
时,我遇到一个错误。当我更改
encoding=“latin1”
时,得到的是NaN值

如果有人已经遇到类似问题或知道如何解决,请提供帮助

提前谢谢

以下是我得到的错误:

UnicodeDecodeError:“utf-8”编解码器无法解码位置中的字节0x92 31:起始字节无效


您可以在文本编辑器(如记事本+)中打开该文件并查看编码。它可能是其他东西,例如UCS2。或者在线使用此选项,您需要了解输入文件的编码。如果是印地语,就不能是不支持这些字符的拉丁文1,而且似乎不是utf-8。对于初学者,我会尝试utf-16或utf-32,让我们看看文件或其中的一部分。您可以在Notepad++之类的文本编辑器中打开文件并查看编码。它可能是其他东西,例如UCS2。或者在线使用此选项,您需要了解输入文件的编码。如果是印地语,就不能是不支持这些字符的拉丁文1,而且似乎不是utf-8。对于初学者,我会尝试utf-16或utf-32,让我们看看这个文件,或者其中的一部分。