Python 空间相似法不';我不能正常工作

Python 空间相似法不';我不能正常工作,python,similarity,word2vec,spacy,cosine-similarity,Python,Similarity,Word2vec,Spacy,Cosine Similarity,我正在使用spacy进行简单的自然语言处理。 我正在通过测量单词之间的相似性来过滤单词 我编写并使用了spacy文档中显示的以下简单代码,但结果看起来不像是一个简单的示例 代码的结果如下所示 dog, dog: 1.0 dog, cat: 2.307269867164827e-21 dog, banana: 0.0 cat, dog: 2.307269867164827e-21 cat, cat: 1.0 cat, banana: -0

我正在使用
spacy
进行简单的自然语言处理。 我正在通过测量单词之间的相似性来过滤单词

我编写并使用了spacy文档中显示的以下简单代码,但结果看起来不像是一个简单的示例

代码的结果如下所示

   dog,    dog: 1.0
   dog,    cat: 2.307269867164827e-21
   dog, banana: 0.0
   cat,    dog: 2.307269867164827e-21
   cat,    cat: 1.0
   cat, banana: -0.04468117654323578
banana,    dog: -7.828739256116838e+17
banana,    cat: -8.242222286053048e+17
banana, banana: 1.0
特别是,“狗”和“猫”之间的相似性应该在0.8左右,但这不是一个非常小的值

此外,“狗”和“香蕉”之间的相似性为0.0,“香蕉”和“狗”之间的相似性为-7.828739256116838e+17

我不知道怎么修理它


请帮帮我

首先安装大型EN型号(或所有型号)

python3-mspacy.en.download all

接下来,根据文档使用

nlp=spacy.load('en\u core\u web\u md')

如果这不起作用,请尝试加载,而不是上面提到的

nlp=spacy.load('en')

完成上述更改后,结果符合文件要求

python3 /tmp/c.py
   dog,    dog: 1.000000078333395
   dog,    cat: 0.8016855098942641
   dog, banana: 0.2432764518408807
   cat,    dog: 0.8016855098942641
   cat,    cat: 1.0000001375986456
   cat, banana: 0.2815436412709355
banana,    dog: 0.2432764518408807
banana,    cat: 0.2815436412709355
banana, banana: 1.000000107068369

我终于解决了这个问题

只需添加代码
将numpy导入为np


就这些

请在重新安装en_core_web_lg型号后试用。我不知道如何重新安装。我试图在spacy文档网页中找到它,但失败了。如果你知道如何重新安装,请告诉我。感谢您的评论和帮助。python-mspacy下载en_core_web_lg--force@AjaySrivastava谢谢你的帮助,正如你所说,我试过了,但遗憾的是,还是没什么不同。谢谢你的帮助,谢谢你的帮助。但是,使用您的解决方案无法解决此问题。它仍然显示错误的相似性结果与您的结果不同。这种解决方案根本没有意义。你甚至没有在你的代码中使用numpy@Ateik是的。正如你所说,我的代码中没有使用
numpy
。但是我通过添加代码来解决这个问题。库
spacy
可能依赖于
numpy
python3 /tmp/c.py
   dog,    dog: 1.000000078333395
   dog,    cat: 0.8016855098942641
   dog, banana: 0.2432764518408807
   cat,    dog: 0.8016855098942641
   cat,    cat: 1.0000001375986456
   cat, banana: 0.2815436412709355
banana,    dog: 0.2432764518408807
banana,    cat: 0.2815436412709355
banana, banana: 1.000000107068369