如何从Python中的UTF-8编码文件中扫描日语（可能是其他多字节）文本？_Python_Encoding_Utf 8

如何从Python中的UTF-8编码文件中扫描日语（可能是其他多字节）文本？

python encoding utf-8

如何从Python中的UTF-8编码文件中扫描日语（可能是其他多字节）文本？,python,encoding,utf-8,Python,Encoding,Utf 8,我试图用Python从UTF-8编码的文件中读取和解释日语文本，但我遇到了一个奇怪的问题；返回的字符串总是完全为空。我没有做任何非正统的事情（我想？）：如果文件仅为英文字符，print（text）将返回预期的输入字符字符串，但如果文件中只有日文字符，print（text）将返回' 有人可以在这里提供指针吗？您的终端是否设置为使用UTF-8编码？如果您尝试简单地cat将文件发送到终端，会发生什么情况？一旦你修好了，我怀疑你的程序会工作。是len（text）zero还是别的什么？谢谢你的帮助！回家

我试图用Python从UTF-8编码的文件中读取和解释日语文本，但我遇到了一个奇怪的问题；返回的字符串总是完全为空。我没有做任何非正统的事情（我想？）：

如果文件仅为英文字符，

print（text）

将返回预期的输入字符字符串，但如果文件中只有日文字符，

print（text）

将返回

有人可以在这里提供指针吗？

您的终端是否设置为使用UTF-8编码？如果您尝试简单地

cat

将文件发送到终端，会发生什么情况？一旦你修好了，我怀疑你的程序会工作。是

len（text）

zero还是别的什么？谢谢你的帮助！回家后让我再检查一下终端设置；我可以肯定地确认len（text）为零，但是您的终端设置为使用UTF-8编码吗？如果您尝试简单地

cat

将文件发送到终端，会发生什么情况？一旦你修好了，我怀疑你的程序会工作。是

len（text）

zero还是别的什么？谢谢你的帮助！回家后让我再检查一下终端设置；但是，我可以肯定地确认len（text）是零

with open(inputFile, 'r', encoding="utf-8") as word_list:
    text = word_list.read()