Algorithm 博弈算法逻辑

Algorithm 博弈算法逻辑,algorithm,logic,gambling,Algorithm,Logic,Gambling,这是一款赛狗游戏,有视频,玩家选择赢家。 根据他们的赌注,该算法选择适当的视频,以保持每个销售点的退货百分比在其指定的金额 大概是这样的: % Returning Specific Return Configuration, range: 50%~90%: POS1: 65% POS2: 78% POS3: 50% ... ... POSN: XX% 每个POS具有不同的收入,应根据其配置返回: Ex: [pos] [cashes] [should return] [returns]

这是一款赛狗游戏,有视频,玩家选择赢家。 根据他们的赌注,该算法选择适当的视频,以保持每个销售点的退货百分比在其指定的金额

大概是这样的:

% Returning Specific Return Configuration, range: 50%~90%:
POS1: 65%
POS2: 78%
POS3: 50%
...
...
POSN: XX%
每个POS具有不同的收入,应根据其配置返回:

Ex: [pos]    [cashes] [should return]   [returns]  [step]
    -------------------------------------------------------
     POS1       100         65             60        44
     POS2       100         78             50        45
     POS3       500        250            150        45
基于某些组合,收益率较低,因此剩余部分被视为债务。 这是因为每家商店都在销售以下数字:

POS1:   [Cashes]    ["Winners" Number]  [Possible Return]
          50           12                 150
          50           13                  60
因此,该算法尝试在受限可能性中找到最接近的组合,该组合返回该值+累计月债务,基于每个步骤,如:

 sum([should return]) of step 45 
   + lowest not returned part of the month ([should return]-[returns]) 
                              of the stores present at that step (45) 
在相对较长的一段时间(约30天,即流程的持续时间阶段)结束时,具体的返回时间为:

POS1: 64.4%
POS2: 72.9%
POS3: 49.2%
...
它现在已经工作了8个月,没有明显的问题,但如果我足够清楚的话,这是正确的逻辑吗

每一步持续5分钟

*编辑*

在返回的百分比上使用一些额外的奖金会抵消负差额,因此“客户债务”(取决于该值)会导致每一步的返回受阻,直到POS返回到其百分比为止

因此,我将“本月最低未返回部分([应返回]-[返回])更改为该步骤中随机挑选的玩家。这有帮助,但还不够,因为当消极的玩家pos在许多连续步骤中是单独的。。。事实上,它没有任何回报。这并不是一件好事,所以我增加了一些实际使用的负债务的限制,随机因素的范围是

sum([should return]) of step 45 
+ ((case when the debt is negative under some relative "considerable" limit) 
    random[range(-0.01, 0.2)] * not returned part of the month ([should return]-[returns]) 
else the ([should return]-[returns]))

实际上,范围(-0.01,0.2)意味着pos可以在某些相对限制下返回,事实上,即使单独玩,商店也开始再次返回。

在没有大量试运行数据的情况下,您的逻辑似乎完全正确。你似乎在准确地追踪债务和回报。因为你的解释集中在硬回报数字和百分比上,这使得你的算法的剖析像harderAs@Dave Alperovich所说的那样,看起来相当合理。我的建议是增加一些随机性(小百分比),作为一个试验。我已经看到了一些非常有趣的结果,当添加一些随机性时,尽管这似乎与直觉相反。事实上,我已经改变了“本月最低未归还部分”,在步骤中使用了“随机选择”的一个商店债务;因此,当POS“独自玩”时,它只选择它的债务。我面临的问题是当债务,在这种情况下是负的,“客户必须回到商店”;当它相当可观的时候,我不得不对它从这笔债务中使用的东西设置一个限制,因为它阻止了每一笔回报,当然,如果可能的话,直到它收回。你能至少解释一下游戏规则,结果应该是什么,POS的意思是什么,正确的答案应该是什么样的吗?