Python 编码';UTF-8';在macOS中引发异常

Python 编码';UTF-8';在macOS中引发异常,python,glove,Python,Glove,我正在尝试读取一个手套文件:GloVe.twitter.27B.200d.txt。我有下一个读取文件的函数: def glove_reader(glove_file): glove_dict = {} with open(glove_file, 'rt', encoding='utf-8') as glove_reader: for line in glove_reader: tokens = line.rstrip().split()

我正在尝试读取一个手套文件:
GloVe.twitter.27B.200d.txt
。我有下一个读取文件的函数:

def glove_reader(glove_file):
    glove_dict = {}
    with open(glove_file, 'rt', encoding='utf-8') as glove_reader:
        for line in glove_reader:
            tokens = line.rstrip().split()
            vect = [float(token) for token in tokens[1:]]
            glove_dict[tokens[0]] = vect
    return glove_dict
问题是我遇到了下一个错误:

UnicodeDecodeError:'utf-8'编解码器无法解码位置0中的字节0xea:无效的连续字节

我尝试了
拉丁语-1
,但没有成功。向我抛出下一个错误:
ValueError:无法将字符串转换为浮点:“Ù\x86”


我还尝试用
'r'
'rb'
更改
'rt'
。我认为这是macOS的一个问题,因为Windows中没有抛出这个错误。有人能帮我知道为什么我看不懂这个文件吗。

我不熟悉手套,但你可能想用
file globot.twitter.27B.200d.txt
确认文件的编码,原因它似乎不是UTF-8。@Luis Miguel包含一个有效且触发上述错误的手套文件示例可能会有所帮助。您能否重新测试
open(手套文件,'r',encoding='latin-1')
,并报告它给出的任何错误?它绝对不应该返回utf-8错误。@whydoubt我用错误更新问题。