Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/typo3/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Text 有人能告诉我如何用图解法计算出简单的余弦相似性吗_Text_Data Mining_Cosine Similarity - Fatal编程技术网

Text 有人能告诉我如何用图解法计算出简单的余弦相似性吗

Text 有人能告诉我如何用图解法计算出简单的余弦相似性吗,text,data-mining,cosine-similarity,Text,Data Mining,Cosine Similarity,有人能告诉我如何计算余弦相似性吗? 我知道以前有人回答过类似的问题,但我不明白最终结果是如何得出的 因为余弦相似方程是 在实验中,选择的答案计算了两个向量,代表两句话的字数 A = (2,1,0,2,0,1,1,1) B = (2,1,1,1,1,0,1,1) 所以我们可以计算A和B的点积 dotProduct(A,B) = 2x2 + 1x1 + 0x1 + 2x1 + 0x1 + 1x0 + 1x1 + 1x1 = 9 A和B的大小是 magnitude(A) = sqrt(2x2 +

有人能告诉我如何计算余弦相似性吗?
我知道以前有人回答过类似的问题,但我不明白最终结果是如何得出的

因为余弦相似方程是

在实验中,选择的答案计算了两个向量,代表两句话的字数

A = (2,1,0,2,0,1,1,1)
B = (2,1,1,1,1,0,1,1)
所以我们可以计算A和B的点积

dotProduct(A,B) = 2x2 + 1x1 + 0x1 + 2x1 + 0x1 + 1x0 + 1x1 + 1x1 = 9
A和B的大小是

magnitude(A) = sqrt(2x2 + 1x1 + 0x0 + 2x2 + 0x0 + 1x1 + 1x1 + 1x1) = 3.464
magnitude(B) = sqrt(2x2 + 1x1 + 1x1 + 1x1 + 1x1 + 0x0 + 1x1 + 1x1) = 3.162
然后我们可以应用这个方程:

similarity = cos(theta) = dotProduct(A,B) / (magnitude(A) x magnitude(B))
                        = 9 / (3.464 x 3.162)
                        = 0.822

式中,θ是向量A和向量B之间的角度

使用公式。你哪里不及格?我不明白等式是哪里不及格的,那你需要买一本线性代数书来研究它!我们不知道从哪里开始。在问题上发布的类似问题链接上,最佳答案显示余弦相似性为0.822。我想知道的是,他是如何从之前的stepHe计算方程中得到答案的,这是一个简单的线性代数。