动态优化:变分法中的欧拉方程
基本问题:有函数$y$表示某种状态在时序$t$上的演化路径,给定弧值函数$F$和目标积分$V(y)=\int_0^TF(t,y,y’)dt$,求使$V$最优化的$y^*$路径。
推导:变分法的核心是研究$y$的微小扰动如何影响目标泛函值。要对路径$y$施加扰动,定义扰动路径$p$和扰动系数$\epsilon$,任意的$y$可表示为$y=y^*+\epsilon p$,其中$p(0)=p(T)=0$,保证起点和终点相同。这个假定也意味着$y’=y^{*’}+\epsilon p’$。最优路径的必要条件是$dV/d\epsilon=0$,但是V是积分,所以我们需要回顾如何对积分求导。对积分求导法则由下式给出,若
$$
K(x)\equiv\int_{a}^{b(x)}F(t,x)dt
$$
则
$$
\frac{dK}{dx}=\int_a^{b(x)}F_x(t,x)dt+F[b(x),x]b’(x)
$$
接着推导欧拉方程。
第一步,代入扰动,求导得零,这是必要条件。
$$
V(\epsilon)=\int_0^TF[t,y^*(t)+\epsilon p(t),y^{*’}(t)+\epsilon p^{\prime}(t)]dt
$$
$$
\begin{gathered}
\frac{dV}{d\epsilon} =\int_0^T\frac{\partial F}{\partial\epsilon}dt=\int_0^T\left(\frac{\partial F}{\partial y}\frac{dy}{d\epsilon}+\frac{\partial F}{\partial y’}\frac{dy’}{d\epsilon}\right)dt \
=\int_0^T\bigl[F_yp(t)+F_{y’}p’(t)\bigr]dt=0
\end{gathered}
$$
第二步,对第二项进行分部积分后再合并。
$$
\int_0^TF_{y’}p’(t)dt={F_{y’}p(t)|_0^T}-\int_0^Tp(t)dF{y’}=-\int_0^Tp(t)\frac{dFy’}{dt}dt
$$
$$
\int_0^Tp(t)[F_y-\frac d{dt}F_{y^{\prime}}]dt=0
$$
这里tricky的地方在于,分部积分中将$dF_{y^{\prime}}$写成了$\frac d{dt}F_{y^{\prime}}dt$,方便合并被积变量。
第三步,$p$是随机的,因此另一个因式恒为零,推导显化的欧拉方程。
$$
F_y-\frac d{dt}F_{y^{\prime}}=0
$$
$$
\frac{dF_{y^{\prime}}}{dt}=\frac{\partial F_{y^{\prime}}}{\partial t}+\frac{\partial F_{y^{\prime}}}{\partial y}\frac{dy}{dt}+\frac{\partial F_{y^{\prime}}}{\partial y^{\prime}}\frac{dy^{\prime}}{dt}=F_{ty’}+F_{yy’}y’(t)+F_{y’y’}y’’(t)
$$
则欧拉方程就为
$$
F_{y^{\prime}y^{\prime}}y^{\prime\prime}(t)+F_{yy^{\prime}}y^{\prime}(t)+F_{ty^{\prime}}-F_{y}=0,{for~}t\in[0,T]
$$
这就是最优化路径需要满足的必要条件。