如何从Python中的UTF-8编码文件中扫描日语(可能是其他多字节)文本?

如何从Python中的UTF-8编码文件中扫描日语(可能是其他多字节)文本?,python,encoding,utf-8,Python,Encoding,Utf 8,我试图用Python从UTF-8编码的文件中读取和解释日语文本,但我遇到了一个奇怪的问题;返回的字符串总是完全为空。我没有做任何非正统的事情(我想?): 如果文件仅为英文字符,print(text)将返回预期的输入字符字符串,但如果文件中只有日文字符,print(text)将返回' 有人可以在这里提供指针吗?您的终端是否设置为使用UTF-8编码?如果您尝试简单地cat将文件发送到终端,会发生什么情况?一旦你修好了,我怀疑你的程序会工作。是len(text)zero还是别的什么?谢谢你的帮助!回家

我试图用Python从UTF-8编码的文件中读取和解释日语文本,但我遇到了一个奇怪的问题;返回的字符串总是完全为空。我没有做任何非正统的事情(我想?):

如果文件仅为英文字符,
print(text)
将返回预期的输入字符字符串,但如果文件中只有日文字符,
print(text)
将返回
'


有人可以在这里提供指针吗?

您的终端是否设置为使用UTF-8编码?如果您尝试简单地
cat
将文件发送到终端,会发生什么情况?一旦你修好了,我怀疑你的程序会工作。是
len(text)
zero还是别的什么?谢谢你的帮助!回家后让我再检查一下终端设置;我可以肯定地确认len(text)为零,但是您的终端设置为使用UTF-8编码吗?如果您尝试简单地
cat
将文件发送到终端,会发生什么情况?一旦你修好了,我怀疑你的程序会工作。是
len(text)
zero还是别的什么?谢谢你的帮助!回家后让我再检查一下终端设置;但是,我可以肯定地确认len(text)是零
with open(inputFile, 'r', encoding="utf-8") as word_list:
    text = word_list.read()