Machine learning 进化计算能成为强化学习的一种方法吗？_Machine Learning_Artificial Intelligence_Reinforcement Learning_Evolutionary Algorithm

Machine learning 进化计算能成为强化学习的一种方法吗？

machine-learning artificial-intelligence

Machine learning 进化计算能成为强化学习的一种方法吗？,machine-learning,artificial-intelligence,reinforcement-learning,evolutionary-algorithm,Machine Learning,Artificial Intelligence,Reinforcement Learning,Evolutionary Algorithm,什么是进化计算？这是一种强化学习的方法吗？还是一种单独的机器学习方法？或者没有请引用用于回答此问题的参考文献。进化计算或进化算法是优化算法，当应用于神经网络（如在神经进化中）时，它们当然可以归类为强化学习的一种形式，虽然它的工作原理与通常的强化学习算法略有不同通常，在进化算法（如遗传算法或进化策略）中，需要优化的个体总数。对于这些个体中的每一个，质量函数用于确定他们的“适合度”（如“适者生存”），并为下一代选择最佳个体。然后，这些“父母”被随机复制、修改、变异，甚至彼此重组——在每种不同的算

什么是进化计算？这是一种强化学习的方法吗？还是一种单独的机器学习方法？或者没有

请引用用于回答此问题的参考文献。

进化计算或进化算法是优化算法，当应用于神经网络（如在神经进化中）时，它们当然可以归类为强化学习的一种形式，虽然它的工作原理与通常的强化学习算法略有不同

通常，在进化算法（如遗传算法或进化策略）中，需要优化的个体总数。对于这些个体中的每一个，质量函数用于确定他们的“适合度”（如“适者生存”），并为下一代选择最佳个体。然后，这些“父母”被随机复制、修改、变异，甚至彼此重组——在每种不同的算法中，这一点的具体实现方式略有不同。最后，这些新的突变和/或重组的父母形成下一代的群体，这个过程再次开始，直到达到某种期望的质量，或质量水平

在神经进化的情况下，个体是神经网络，通过随机改变权重（而在经典神经网络中，权重根据非常精确的数学规则进行更新）或甚至改变其拓扑结构进行变异，个人的素质取决于他们在训练数据上的表现

抱歉，这里没有硬性的科学参考，但也许这仍然有助于澄清一些问题。

强化学习[1]和进化计算[2]之间的主要区别在于，原始意义上的RL应用于环境中的代理，学习策略（另请参阅Wikipedia上的文章），而EC是一个更为通用的术语，用于描述一类使用“进化”方法优化搜索的搜索算法。我根本不会把电子商务归类为机器学习，而且我还没有找到一个这样的来源

[1] 强化学习：导论-RS萨顿，AG巴托-1998-剑桥大学出版社

[2] 什么是进化计算DB Fogel-Spectrum，IEEE，2000

有一些进化方法明确旨在解决强化学习问题。该子字段通常称为学习分类器系统（LCS）或偶尔称为基于遗传学的机器学习（GBML）

除此之外，我不确定你的问题是否有明确的答案。它基本上归结为“什么是机器学习？”对于如何回答这个问题，我们并没有达成一致的标准。对某些人来说，EC可能是该子领域的一部分。对其他人来说，情况并非如此。我刚从书架上取了几本ML教科书，其中大约一半包含进化方法的材料。我怀疑15年前这个比例会更高，但时尚在改变，机器学习现在几乎是统计学的一个分支。EC方法不太适合这种模式

那么，进化计算在哪里？这是一种强化学习的方法吗？还是一种单独的机器学习方法？或者没有

我认为EC和ML彼此不同。然而，有一些伟大的应用在那里乳清他们一起使用。虽然这是一个很小的研究领域已经有相当一段时间了，但我觉得在结合EC和ML方面有一些不太可能实现的成果。我认为很多人没有耐心看穿这些想法。

2017年更新：答案是肯定的。“进化策略作为强化学习的可扩展替代方案”这个名字恰如其分，确实是人们谈论的话题。

谢谢你的回答，但主要问题是在可靠的参考文献中对与强化学习相关的进化算法进行分类我不同意。RL需要通过状态和动作序列与环境进行交互。进化算法就是不符合这个模式。答案不错，但我看过一所大学的演示，其中一种ML方法是进化的。另外，请看这里：它说“一些作者将EC分类为一种特定类型的ML”，我们需要的是一些参考文献，确切地说，因为旁白[1]提到RL可以用于解决规划问题，这是进化计算的一种常见用法。这是迄今为止最好的答案，但我将继续搜索。。。谢谢你的回答！