Algorithm 特定实体的特征向量计算

Algorithm 特定实体的特征向量计算,algorithm,machine-learning,Algorithm,Machine Learning,我在这个特定的场景中工作: 我有一个实体列表。每个实体(e)由项目L(e)的列表描述。 属于L(e)的每个项目(i)都有一组与其关联的特征(在本例中是URI)(例如,假设一个大小为N=3的特征向量:项目1=A1、B1、C2;项目2=A1、B2、C2;…) 在这种特定情况下,项目可以由以下向量表示: | dbpedia-owl:director | dbpedia-owl:producer // attributes' names dbpedia:Quentin_Tarantin

我在这个特定的场景中工作: 我有一个实体列表。每个实体(e)由项目L(e)的列表描述。 属于L(e)的每个项目(i)都有一组与其关联的特征(在本例中是URI)(例如,假设一个大小为N=3的特征向量:项目1=A1、B1、C2;项目2=A1、B2、C2;…)

在这种特定情况下,项目可以由以下向量表示:

| dbpedia-owl:director         | dbpedia-owl:producer // attributes' names

dbpedia:Quentin_Tarantino      |  dbpedia:Lawrence_Bender // attributes' values
我想从属于实体的项目列表的每个项目的特征向量开始,计算每个实体的代表向量(质心?)。 你能给我建议一种正确计算它的方法吗

我需要这种表示,以便能够计算项目之间的相似性(可以使用属性的Jaccard索引完成)和实体之间的相似性(在我的例子中,它们是电影)。 如果我有一个特定实体的特定向量表示,我将能够计算项目和实体之间的相似性得分


提前谢谢你

你能举例说明实体的项目列表是什么样的吗?对不起,这还不清楚,它不是列表或向量。你可以随心所欲地表示它。重要的一点是,每一项都可以用这两个特性来表示(这只是一个示例,可以有两个以上的属性):dbpedia owl:director和dbpedia owl:producer。我还不清楚您到底想要实现什么。这种“陈述”的目的是什么?在什么情况下会使用它?e、 g.分类?集群?还有别的吗?如果您能给出输入和输出的示例(如您所设想的),这将有所帮助。我希望现在已经很清楚了