Algorithm 应用最近邻算法时,电子商务数据最合适的距离度量是什么?

Algorithm 应用最近邻算法时,电子商务数据最合适的距离度量是什么?,algorithm,distance,nearest-neighbor,knn,Algorithm,Distance,Nearest Neighbor,Knn,我有一个电子商务网站的数据集。数据以矩阵形式排列,其中行数与交易数(购买的产品集)相同,列数与网站上可用的产品总数相同。因此,如果产品j是在交易i中购买的,则矩阵的每个[i,j]单元要么是1,要么是0。现在,当一个新的事务到来时,我想为这个事务找到k个最近的邻居。对于这些数据,最合适的衡量标准是什么?e、 g.即使数据是二进制的(1/0),汉明距离也没有任何意义

我有一个电子商务网站的数据集。数据以矩阵形式排列,其中行数与交易数(购买的产品集)相同,列数与网站上可用的产品总数相同。因此,如果产品
j
是在交易
i
中购买的,则矩阵的每个
[i,j]
单元要么是
1
,要么是
0
。现在,当一个新的事务到来时,我想为这个事务找到k个最近的邻居。对于这些数据,最合适的衡量标准是什么?e、 g.即使数据是二进制的
(1/0)
,汉明距离也没有任何意义