Machine learning 如何使用词向量进行度量

Machine learning 如何使用词向量进行度量,machine-learning,deep-learning,word2vec,Machine Learning,Deep Learning,Word2vec,我试图理解如何使用单词嵌入来测量偏差。阅读文章 在上述声明中确定的偏差是什么?这里是否存在这样一种偏见,即当涉及到男性时,女性不能被视为医生 是一种中性的偏见,无论是男性还是女性被识别,都是女性、医生、男性、医生之间存在微小差异的地方,用一个向量表示:$woman+doctor\approx man+doctor$?你会想到的 woman + doctor = man + doctor 或重写: woman + doctor - man = doctor 但是,由于在这个词的嵌入空间中是“

我试图理解如何使用单词嵌入来测量偏差。阅读文章

在上述声明中确定的偏差是什么?这里是否存在这样一种偏见,即当涉及到男性时,女性不能被视为医生

是一种中性的偏见,无论是男性还是女性被识别,都是女性、医生、男性、医生之间存在微小差异的地方,用一个向量表示:$woman+doctor\approx man+doctor$?

你会想到的

woman + doctor = man + doctor
或重写:

woman + doctor - man = doctor
但是,由于在这个词的嵌入空间中是“护士”,这是一个指标,表明在医疗保健领域对女性的偏见被视为护士。 在训练嵌入词的语料库中,医生更多地与男性相关,因此可以得出结论,语料库(以及学习词嵌入)存在性别偏见