Mapreduce 不能应用map-reduce模型的机器学习算法

Mapreduce 不能应用map-reduce模型的机器学习算法,mapreduce,machine-learning,Mapreduce,Machine Learning,“多核机器学习的Map-Reduce”一文展示了10种机器学习算法,这些算法可以从Map-Reduce模型中获益。关键点是“任何适合统计查询模型的算法都可以用某种“求和形式”来编写,这些算法可以表示为求和形式,可以应用map-reduce编程模型 对于那些不能表示为求和形式的算法,并不意味着它们不能应用map-reduce模型。有人能指出任何特定的机器学习算法,它们不能通过map-reduce模型来加速吗?当数据中存在计算依赖性时,MapReduce不起作用。这一限制使其难以实现F无法表示在结构

“多核机器学习的Map-Reduce”一文展示了10种机器学习算法,这些算法可以从Map-Reduce模型中获益。关键点是“任何适合统计查询模型的算法都可以用某种“求和形式”来编写,这些算法可以表示为求和形式,可以应用map-reduce编程模型


对于那些不能表示为求和形式的算法,并不意味着它们不能应用map-reduce模型。有人能指出任何特定的机器学习算法,它们不能通过map-reduce模型来加速吗?

当数据中存在计算依赖性时,MapReduce不起作用。这一限制使其难以实现F无法表示在结构化模型上运行的算法

因此,当面对大规模问题时,我们通常会放弃丰富的结构化模型,转而采用符合MapReduce抽象的过于简单的方法

在机器学习领域,许多算法在学习和推理过程中迭代地变换参数,例如信念传播、期望最大化、梯度下降和吉布斯采样。这些算法迭代地细化一组参数,直到某些终止条件匹配为止

如果您在每次迭代中调用MapReduce,是的,我认为您仍然可以加快计算速度。这里的要点是,我们需要一个更好的抽象框架,以便能够采用数据的图形结构,表示复杂的调度或自动评估终止


顺便说一句,这是出于上述原因而提出的备选方案之一。

你可以将每种算法放入mapreduce,但这并不意味着它们工作效率高。是的,我知道我们可以将map reduce应用于每种算法,但这并不意味着我们可以提高某些算法的性能。我上面提到的论文列出了10种算法他们展示了如何将原始算法转换成所谓的“求和形式”“。然后,我们可以将map-reduce技术应用于求和形式。我想知道哪种算法不能从map-reduce模型中受益。谢谢你的回答。因此,BP、EM、GD和Gibbs采样不能受益于map-reduce模型,对吗?正如我所知,我在上面列出的论文中的EM和批梯度下降可以从map reduce中受益。作者说,随机梯度下降并非如此,即使在大规模问题上,GSD通常比GD更有效。是的,我同意EM和批量GD可以从map/REDUCT中获益。我想指出的是,有时我们是否能从map/reduce中获益,并不像拥有更好的抽象模型那么重要。见我最后的第二段。加速算法的能力并不意味着它是最好的模型。通过使用另一个模型,我们可能可以大大加快速度。