Text 有人能告诉我如何用图解法计算出简单的余弦相似性吗
有人能告诉我如何计算余弦相似性吗?Text 有人能告诉我如何用图解法计算出简单的余弦相似性吗,text,data-mining,cosine-similarity,Text,Data Mining,Cosine Similarity,有人能告诉我如何计算余弦相似性吗? 我知道以前有人回答过类似的问题,但我不明白最终结果是如何得出的 因为余弦相似方程是 在实验中,选择的答案计算了两个向量,代表两句话的字数 A = (2,1,0,2,0,1,1,1) B = (2,1,1,1,1,0,1,1) 所以我们可以计算A和B的点积 dotProduct(A,B) = 2x2 + 1x1 + 0x1 + 2x1 + 0x1 + 1x0 + 1x1 + 1x1 = 9 A和B的大小是 magnitude(A) = sqrt(2x2 +
我知道以前有人回答过类似的问题,但我不明白最终结果是如何得出的 因为余弦相似方程是 在实验中,选择的答案计算了两个向量,代表两句话的字数
A = (2,1,0,2,0,1,1,1)
B = (2,1,1,1,1,0,1,1)
所以我们可以计算A和B的点积
dotProduct(A,B) = 2x2 + 1x1 + 0x1 + 2x1 + 0x1 + 1x0 + 1x1 + 1x1 = 9
A和B的大小是
magnitude(A) = sqrt(2x2 + 1x1 + 0x0 + 2x2 + 0x0 + 1x1 + 1x1 + 1x1) = 3.464
magnitude(B) = sqrt(2x2 + 1x1 + 1x1 + 1x1 + 1x1 + 0x0 + 1x1 + 1x1) = 3.162
然后我们可以应用这个方程:
similarity = cos(theta) = dotProduct(A,B) / (magnitude(A) x magnitude(B))
= 9 / (3.464 x 3.162)
= 0.822
式中,θ是向量A和向量B之间的角度使用公式。你哪里不及格?我不明白等式是哪里不及格的,那你需要买一本线性代数书来研究它!我们不知道从哪里开始。在问题上发布的类似问题链接上,最佳答案显示余弦相似性为0.822。我想知道的是,他是如何从之前的stepHe计算方程中得到答案的,这是一个简单的线性代数。