Neural network 倒立摆的适应度

Neural network 倒立摆的适应度,neural-network,genetic-algorithm,fitness,Neural Network,Genetic Algorithm,Fitness,用于求解倒立摆的适应度函数是什么 我正在用遗传算法进化神经网络。我不知道如何评估每个人 我尝试在评估时间(10秒)结束时最小化钟摆角度并最大化移动距离,但这不起作用 神经网络的输入为:小车速度、小车位置、摆锤角速度和时间(t)的摆锤角。输出是在时间(t+1)上施加的力 提前感谢。我找到了将其目标函数列为: 定义为: 其中“Xmax=1.0,thetaMax=pi/6,X'max=1.0,theta'max= 3.0,N是迭代步数,T=0.02*TS和Wk是选定的正权重。”(使用论文中的角度、

用于求解倒立摆的适应度函数是什么

我正在用遗传算法进化神经网络。我不知道如何评估每个人

我尝试在评估时间(10秒)结束时最小化钟摆角度并最大化移动距离,但这不起作用

神经网络的输入为:小车速度、小车位置、摆锤角速度和时间(t)的摆锤角。输出是在时间(t+1)上施加的力

提前感谢。

我找到了将其目标函数列为:

定义为:

其中“Xmax=1.0,thetaMax=pi/6,X'max=1.0,theta'max= 3.0,N是迭代步数,T=0.02*TS和Wk是选定的正权重。”(使用论文中的角度、速度和位置的特定值,但是,您需要根据摆锤的边界条件使用自己的值)

文章还指出,“第一项和第二项决定了 X1和X3与零和第三项的标准化绝对偏差最小时,生存时间最大。”

这应该足够开始了,但我强烈建议你阅读整篇文章。这是一本很棒的书,我觉得它很有教育意义

你可以做你自己的适应度函数,但我认为使用位置、速度、角度和摆角的变化率来做适应度函数是个好主意。但是,您可以选择以与本文作者选择的函数建模方式截然不同的方式使用这些变量

读一读谐波振荡器也没什么坏处。它们的一般形式如下:

mx“+Bx'-kx=Acos(w*t)


(式中,B或A可能为0,具体取决于振荡器是否分别为阻尼/无阻尼或驱动/未驱动).

非常感谢您的回答,我也尝试过最大限度地延长平衡杆的持续时间,但没有找到如何使小车在轨道边界内移动……无论如何,我将尝试本文的适用性,我看看会发生什么