Mapreduce 不能应用map-reduce模型的机器学习算法_Mapreduce_Machine Learning

Mapreduce 不能应用map-reduce模型的机器学习算法

mapreduce machine-learning

Mapreduce 不能应用map-reduce模型的机器学习算法,mapreduce,machine-learning,Mapreduce,Machine Learning,“多核机器学习的Map-Reduce”一文展示了10种机器学习算法，这些算法可以从Map-Reduce模型中获益。关键点是“任何适合统计查询模型的算法都可以用某种“求和形式”来编写，这些算法可以表示为求和形式，可以应用map-reduce编程模型对于那些不能表示为求和形式的算法，并不意味着它们不能应用map-reduce模型。有人能指出任何特定的机器学习算法，它们不能通过map-reduce模型来加速吗？当数据中存在计算依赖性时，MapReduce不起作用。这一限制使其难以实现F无法表示在结构

“多核机器学习的Map-Reduce”一文展示了10种机器学习算法，这些算法可以从Map-Reduce模型中获益。关键点是“任何适合统计查询模型的算法都可以用某种“求和形式”来编写，这些算法可以表示为求和形式，可以应用map-reduce编程模型

对于那些不能表示为求和形式的算法，并不意味着它们不能应用map-reduce模型。有人能指出任何特定的机器学习算法，它们不能通过map-reduce模型来加速吗？

当数据中存在计算依赖性时，MapReduce不起作用。这一限制使其难以实现F无法表示在结构化模型上运行的算法

因此，当面对大规模问题时，我们通常会放弃丰富的结构化模型，转而采用符合MapReduce抽象的过于简单的方法

在机器学习领域，许多算法在学习和推理过程中迭代地变换参数，例如信念传播、期望最大化、梯度下降和吉布斯采样。这些算法迭代地细化一组参数，直到某些终止条件匹配为止

如果您在每次迭代中调用MapReduce，是的，我认为您仍然可以加快计算速度。这里的要点是，我们需要一个更好的抽象框架，以便能够采用数据的图形结构，表示复杂的调度或自动评估终止

顺便说一句，这是出于上述原因而提出的备选方案之一。

你可以将每种算法放入mapreduce，但这并不意味着它们工作效率高。是的，我知道我们可以将map reduce应用于每种算法，但这并不意味着我们可以提高某些算法的性能。我上面提到的论文列出了10种算法他们展示了如何将原始算法转换成所谓的“求和形式”“。然后，我们可以将map-reduce技术应用于求和形式。我想知道哪种算法不能从map-reduce模型中受益。谢谢你的回答。因此，BP、EM、GD和Gibbs采样不能受益于map-reduce模型，对吗？正如我所知，我在上面列出的论文中的EM和批梯度下降可以从map reduce中受益。作者说，随机梯度下降并非如此，即使在大规模问题上，GSD通常比GD更有效。是的，我同意EM和批量GD可以从map/REDUCT中获益。我想指出的是，有时我们是否能从map/reduce中获益，并不像拥有更好的抽象模型那么重要。见我最后的第二段。加速算法的能力并不意味着它是最好的模型。通过使用另一个模型，我们可能可以大大加快速度。