Python 尝试使用pandas从csv文件读取印地语文本时出现编码错误_Python_Pandas_Csv_Hindi

Python 尝试使用pandas从csv文件读取印地语文本时出现编码错误

python pandas csv

Python 尝试使用pandas从csv文件读取印地语文本时出现编码错误,python,pandas,csv,hindi,Python,Pandas,Csv,Hindi,我正在尝试使用pandas从csv文件中读取Devanagari文本。使用encoding=“utf-8”时，我遇到一个错误。当我更改encoding=“latin1”时，得到的是NaN值如果有人已经遇到类似问题或知道如何解决，请提供帮助提前谢谢以下是我得到的错误： UnicodeDecodeError:“utf-8”编解码器无法解码位置中的字节0x92 31:起始字节无效您可以在文本编辑器（如记事本+）中打开该文件并查看编码。它可能是其他东西，例如UCS2。或者在线使用此选项，您需要了

我正在尝试使用pandas从csv文件中读取Devanagari文本。使用

encoding=“utf-8”

时，我遇到一个错误。当我更改

encoding=“latin1”

时，得到的是NaN值

如果有人已经遇到类似问题或知道如何解决，请提供帮助

提前谢谢

以下是我得到的错误：

UnicodeDecodeError:“utf-8”编解码器无法解码位置中的字节0x92 31:起始字节无效

您可以在文本编辑器（如记事本+）中打开该文件并查看编码。它可能是其他东西，例如UCS2。或者在线使用此选项，您需要了解输入文件的编码。如果是印地语，就不能是不支持这些字符的拉丁文1，而且似乎不是utf-8。对于初学者，我会尝试utf-16或utf-32，让我们看看文件或其中的一部分。您可以在Notepad++之类的文本编辑器中打开文件并查看编码。它可能是其他东西，例如UCS2。或者在线使用此选项，您需要了解输入文件的编码。如果是印地语，就不能是不支持这些字符的拉丁文1，而且似乎不是utf-8。对于初学者，我会尝试utf-16或utf-32，让我们看看这个文件，或者其中的一部分。