Artificial intelligence 遗传规划-适应度函数

Artificial intelligence 遗传规划-适应度函数,artificial-intelligence,machine-learning,genetic-algorithm,genetic-programming,Artificial Intelligence,Machine Learning,Genetic Algorithm,Genetic Programming,假设我有一组训练示例,其中a_I是一个属性,结果是二进制的(是或否): 我知道我必须定义适应度函数。但是这个问题的原因是什么呢?在我的实际问题中,有10个参数和100个训练示例,但这是一个类似的问题。我认为这里的混淆来自于这样一个事实,即通常适应度函数会返回一些标量,有时是在离散尺度上,但从来不会返回二进制是/否(或真/假)。从这个意义上讲,这看起来更像是一个需要用神经网络(或者可能是贝叶斯逻辑)解决的“分类”问题。这么说吧,你当然可以设计一个遗传算法来进化任何类型的分类器,适应度函数基本上可以

假设我有一组训练示例,其中
a_I
是一个属性,结果是二进制的(是或否):


我知道我必须定义适应度函数。但是这个问题的原因是什么呢?在我的实际问题中,有10个参数和100个训练示例,但这是一个类似的问题。

我认为这里的混淆来自于这样一个事实,即通常适应度函数会返回一些标量,有时是在离散尺度上,但从来不会返回二进制是/否(或真/假)。从这个意义上讲,这看起来更像是一个需要用神经网络(或者可能是贝叶斯逻辑)解决的“分类”问题。这么说吧,你当然可以设计一个遗传算法来进化任何类型的分类器,适应度函数基本上可以用正确的分类来表示,而不是总的评估

另一种纯粹的GA方法——可能与问题更相关——是将整个分类规则集编码为遗传算法的给定个体。从这个意义上讲,适应度函数可以表示为一个标量,表示给定的候选解决方案在总体上得到了多少个是/否分类,以此类推。本文中也可以找到类似的方法

示例(可能的编码方式之一):

编码:红=000,暗=001,大=010,绿=011,小=100,橙=101,亮=111,等等。 结果:是=1,否=0

染色体:

A1,             A2,             A3,             Outcome
000             001             010             1
011             001             100             1
101             111             010             0
以上所有内容都转化为候选解决方案,如下所示:

000001010-1/011001100-1/101111010-0
通过测试整个规则集的适用性(规则集中的正确分类/总分类),您将生成一组随机的规则,并以您喜欢的任何方式对它们进行演化(请小心选择您的交叉策略!)

我还建议你听一听a,让你有心情


注意:我非常怀疑这是否适用于仅由3条规则组成的规则集,这对于GA来说不够广泛。

我给每个了解实际问题的人5美元。@SpyrosP,我将向您发送我的paypal信息;)。我明白他在问什么,尽管我没有答案……是的,考虑A1、A2、A3为观察变量。观察这些变量,你也会发现它们有特定的结果。A1=一些人的汽车颜色,A2=天空暗或亮,A3=他开的是大的还是小的车。现在假设你所有的数据都来自车祸,你的结果是“这家伙因为车祸需要去医院吗?”。使用输入和结果,您尝试构建一个函数(模型),以预测未来该人是否需要去医院,如果他撞车了。这是很做作的,但应该有助于您understand@SpyrosP-OP想要生成一个程序,该程序接受i参数
[a_1-a_i]
,并返回是或否。@SpyrosP我得到那5美元了吗?;)@谢谢你的回答。如果我选择一个染色体设计,这三个例子分别是100101010、010100110、001010101(第一个例子是100,因为第一个属性是红色,后面是10,因为第二个属性是黑色,后面是10,因为第三个属性是大的,后面是10,因为这是一个“是”的例子)那么你认为你能把适应度函数应用到一个例子中,这样我就能更好地理解你的意思了吗?我也要看看这张报纸+1为此,谢谢:)。轻微更正:适用于初始随机假设的适应度函数。我可以编一个:010101010。我用一个例子编辑了答案。是的,您将生成一组随机的二进制字符串作为开始,并将它们提供给GA。希望这有帮助!我发现二进制solo非常鼓舞人心:)GA方案也许可以解决vivid的问题。然而,查看基于所有可能属性组合的规则意味着在由所有假设组成的假设空间中进行搜索。因此,学习者中唯一的偏见是通过交叉/变异算子引入的偏见,这可能是不自然的,可能不会导致良好的泛化。为了提供帮助,请根据您对问题的领域知识,考虑一组受限(参数化)规则,引入更多偏见。例如,由范围/截止值或属性对(差异)组成的规则,并演化这些参数
A1,             A2,             A3,             Outcome
000             001             010             1
011             001             100             1
101             111             010             0
000001010-1/011001100-1/101111010-0