Algorithm 存储和比较多维向量

Algorithm 存储和比较多维向量,algorithm,vector,database-design,Algorithm,Vector,Database Design,我有n度的多维向量。最好的处理方法是什么 存储(存储它们的最佳模式是什么,SQL、Mongo、Document?) 比较(我如何比较其中两个并找到相似之处) 例如: a{1,3,4,1,-1}, b{2,3,3,0,0}, c{2,3,2,8,9} 如果我们比较以上两种情况,a和b更相似 你是如何大规模地做到这一点的?我想存储数千个这样的向量 类似地,也可以是向量距离 我对存储的赌注是图形数据库,比如Neo4j。您可以使用Cypher查询计算欧几里德距离(并可能实现k-means聚类以获得

我有n度的多维向量。最好的处理方法是什么

  • 存储(存储它们的最佳模式是什么,SQL、Mongo、Document?)
  • 比较(我如何比较其中两个并找到相似之处)
例如:

a{1,3,4,1,-1},
b{2,3,3,0,0},
c{2,3,2,8,9}
如果我们比较以上两种情况,
a
b
更相似

你是如何大规模地做到这一点的?我想存储数千个这样的向量


类似地,也可以是向量距离

我对存储的赌注是图形数据库,比如Neo4j。您可以使用Cypher查询计算欧几里德距离(并可能实现k-means聚类以获得最近的点)

有关实现的详细信息,请参阅以下文章--


我的存储赌注是图形数据库,比如Neo4j。您可以使用Cypher查询计算欧几里德距离(并可能实现k-means聚类以获得最近的点)

有关实现的详细信息,请参阅以下文章--


是固定的还是可以改变?存储器是否必须处理具有不同值
n
的向量?为什么
a
b
更相似(比什么更相似)?计算相似度的算法是什么?是否要计算每对向量之间的相似度?相似度是向量距离(更新的问题)。是的,n是常数。如果
n
是常数,你可以将向量存储在一个表中,表中有
n
列,每个维度一列。我的其他问题呢?我想找出每个向量之间的欧几里德距离。如果我们将它们存储在表格中,我不认为这是可以做到的,请参见我添加的等式。
n
是固定的还是可以改变的?存储器是否必须处理具有不同值
n
的向量?为什么
a
b
更相似(比什么更相似)?计算相似度的算法是什么?是否要计算每对向量之间的相似度?相似度是向量距离(更新的问题)。是的,n是常数。如果
n
是常数,你可以将向量存储在一个表中,表中有
n
列,每个维度一列。我的其他问题呢?我想找出每个向量之间的欧几里德距离。如果我们将它们存储在表格中,我不认为这是可以做到的,请参见我添加的等式。