Machine learning 一种确定性在线算法的性能

Machine learning 一种确定性在线算法的性能,machine-learning,expert-system,bandit,Machine Learning,Expert System,Bandit,我试图解决教科书中的以下问题: 亚历山德斯·斯里夫金斯的《多武装匪徒导论》 问题: 证明了专家问题的任何确定性算法都有N个专家和0个专家−1对于某些确定的、不经意的对手,成本可能遭受总成本T,即使事后看来最好的专家所产生的成本最多为T/N” 提示:修正算法。通过在roundt上归纳构建问题实例,使所选手臂的成本为1,所有其他手臂的成本为0 有人能建议如何解决这个问题吗

我试图解决教科书中的以下问题: 亚历山德斯·斯里夫金斯的《多武装匪徒导论》

问题:

证明了专家问题的任何确定性算法都有N个专家和0个专家−1对于某些确定的、不经意的对手,成本可能遭受总成本T,即使事后看来最好的专家所产生的成本最多为T/N”

提示:修正算法。通过在roundt上归纳构建问题实例,使所选手臂的成本为1,所有其他手臂的成本为0

有人能建议如何解决这个问题吗