Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/272.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 聚合百分比所需的算法帮助_Php_Algorithm_Math_Percentage - Fatal编程技术网

Php 聚合百分比所需的算法帮助

Php 聚合百分比所需的算法帮助,php,algorithm,math,percentage,Php,Algorithm,Math,Percentage,我试图找出如何构建一个特定的算法(最终是用PHP实现的,但这并不重要),但我很难找到最好的算法。我将在这里使用一个疯狂的隐喻(数学才是最重要的),而不是定义一个复杂的特定于行业的流程。想象一下,你正试图根据商店内出售的商品,确定某一特定品牌的汽车停放在商店停车场的概率百分比。首先,你要对100000个商店停车场进行实地调查,记录在外面发现的每一种独特的汽车品牌、商店内出售的每一种独特的商品,以及该商品与商店的固定相关性百分比(例如:木材与家得宝的相关性为89%,而铅笔与沃尔玛的相关性仅为23%)

我试图找出如何构建一个特定的算法(最终是用PHP实现的,但这并不重要),但我很难找到最好的算法。我将在这里使用一个疯狂的隐喻(数学才是最重要的),而不是定义一个复杂的特定于行业的流程。想象一下,你正试图根据商店内出售的商品,确定某一特定品牌的汽车停放在商店停车场的概率百分比。首先,你要对100000个商店停车场进行实地调查,记录在外面发现的每一种独特的汽车品牌、商店内出售的每一种独特的商品,以及该商品与商店的固定相关性百分比(例如:木材与家得宝的相关性为89%,而铅笔与沃尔玛的相关性仅为23%)

我要解决的问题有两部分。首先,我试图找出将这些数据汇总到一个特定项目的最佳方法,同时考虑每个相关性百分比和确认观察的数量(因此一次发现不等于100%的机会,类似于)。换句话说,如果一家全新的、前所未见的商店正在出售沃特福德眼镜和开司米毛衣,从这些商品中我们可以预测,有89%的可能性有一辆梅赛德斯在停车场

因此,总结一下: 每种商品在商店中都有特定的出现次数。每一次,都有一个不同的产品/商店关联百分比和停车场所有汽车品牌的列表。我怎样才能最好地数学计算出某个品牌在一个全新商店停车场的概率百分比,仅基于其中的商品

现在,通过添加另一层抽象,第二部分变得更加复杂。如果一个人参观了50家商店,我们将所有这些商店的所有商品汇总在一起,我们就可以预测他们开的是什么类型的车(例如:很多野营和徒步旅行商店,所以他们有67%的机会开吉普车)。然后,如果他们访问一家新店并接触到一个全新的商品,我们没有数据,我需要将67%的吉普车应用到新商品上(仍然尊重该商品与商店的相关性)。然后,使用该项目的小于特定吉普车统计数据来影响我们对包含该新项目的停车场的预测(从未直接测量)。也许这需要我们增加某种置信区间?或者,如果我们分析的数百万项中没有一项最终平均达到50%,我们又如何表示这种不确定性呢


我真的很感谢你在这方面的帮助

我认为,你需要建立互相关矩阵, 其中行是货物,列是车辆类型。 每个单元格都包含归一化系数,如何计算 好(即钻石戒指)与车型(Geo或梅赛德斯)相关

详情请参阅:


这看起来像是统计学中的练习,一旦算出方程式,算法应该非常简单和/或经典。它很可能涉及混合模型中的推理。我认为这个问题更适合math.stackexchange,然后,一旦你从那里得到了模型和抽象推理算法,如果你在实现上有困难,你可以在这里发布。此外,“商品与商店的相关性”是什么意思还不是很清楚,除了商品在商店的预期销售率之外,车辆类型分布的平均值。如果你指的是其他东西,你应该澄清。一件物品与商店的相关性是从公司其他地方确定的百分比。这只是一个简单的百分比-百分比越高,产品与商店的关系就越密切(例如手机与AT&T商店的关系非常密切)。在这个算法中,只不过是一个基本的百分比而已。这似乎有点过于苛刻了。我在想一些更简单的事情,比如“把这些加在一起,乘以X”或者别的什么。你认为这里真的需要这样的东西吗?是的,这是“加法和乘法”。对于每种可能的对/车组合。