Math 建立排名/评分系统的数学模型

Math 建立排名/评分系统的数学模型,math,machine-learning,mathematical-optimization,stat,Math,Machine Learning,Mathematical Optimization,Stat,我想给一组卖家排名。每个卖方由参数var1、var2、var3、var4…var20定义。我想给每个卖家打分 目前,我通过分配这些参数的权重来计算分数(比如10%分配给var1,20%分配给var2等等),这些权重是根据我的直觉确定的 我的分数方程看起来像 score = w1* var1 +w2* var2+...+w20*var20 score = 0.1*var1+ 0.5 *var2 + .05*var3+........+0.0001*var20 我的分数方程也可以是 score

我想给一组卖家排名。每个卖方由参数var1、var2、var3、var4…var20定义。我想给每个卖家打分

目前,我通过分配这些参数的权重来计算分数(比如10%分配给var1,20%分配给var2等等),这些权重是根据我的直觉确定的

我的分数方程看起来像

score = w1* var1 +w2* var2+...+w20*var20
score  = 0.1*var1+ 0.5 *var2 + .05*var3+........+0.0001*var20
我的分数方程也可以是

score = w1^2* var1 +w2* var2+...+w20^5*var20
其中var1,var2,…var20是标准化的

我应该使用哪个等式? 科学确定的方法是什么,分配的权重是什么

我想优化这些权重,使用一些面向数据的方法改进评分机制,以获得更相关的分数

例子 我有以下特点为卖家

1] 订单履行率[数字]

2] 订单取消率[数字]

3] 用户评分[1-5]{1-2:最差,3:平均,5:良好}[分类]

4] 确认订单所需的时间。(卖方花费的时间越短越好)[数字]

5] 价格竞争力

有没有更好的算法/方法来解决这个问题?计算分数?i、 e我线性添加了各种功能,我想知道构建排名系统的更好方法

如何提供权重值


除了使用上述功能外,我能想到的只有正面评论与负面评论的比率、受损商品的比率等。这些如何符合我的评分公式?

不幸的是,stackoverflow没有乳胶,因此图像必须:

作为免责声明,我不认为这是一个简洁的答案,但你的问题相当广泛。这还没有经过测试,但考虑到类似的问题,我很可能会采用这种方法

作为一个可能的方向,下面是
多元高斯
。其想法是,每个参数都有自己的维度,因此可以根据重要性进行加权。例如:

Sigma = [1,0,0;0,2,0;0,0,3] for a vector [x1,x2,x3] the x1 would have the greatest importance.
  • 协方差矩阵
    Sigma
    负责每个维度的缩放。要实现这一点,只需将对角矩阵nxn的权重添加到对角元素。你并不真正关心交叉术语
  • Mu
    是卖家数据中所有日志的平均值,是一个向量
  • x
    是特定卖家的每个类别的平均值,作为向量
    x={x1,x2,x3…,xn}
    。这是随着收集更多数据而不断更新的值
  • 基于整个数据集的函数参数也应该不断变化。这样就可以剔除有偏见的投票,特别是基于“感觉”的类别


    设置完成后,可以对函数
    f_x
    进行评估,以获得所需的结果。这是一个概率密度函数,但其实用性并不局限于统计数据

    您的问题可能会因为过于宽泛而被关闭,但我可能会从随机林开始,因为您有一个相当小的功能集。您还可以尝试寻找矩阵方程的最佳拟合解决方案。random forest是一个分类器,但我想计算权重,然后查找评分公式random forests还将为您提供每个预测值的重要度量,以及一个可以预测新的未知输入将如何响应的函数。这是一个函数,就像任何其他机器学习方法一样。我也可以使用基尼指数或熵来确定哪个预测器是重要的。有助于对大量数据点进行分类的功能将在此处排名更高。但假设我是卖家排名。我正在查看一些功能,如完成的订单数量和失败的订单数量。我要看的是我给这些特征分配了什么权重?a呢?这允许每个变量有自己的量表和一个分数值。