離散と連続の対応関係

Published

2024-08-23

Modified

2024-08-23

もっともシンプルなケース

モデル
- x(k+1) = f(x(k), u(k)m ,k), \quad k=0,1,\cdots, N
- \dot{x}(t) = f(x(t), u(t), t), \quad t\in [t_0, t_f]
評価関数
- J = \varphi(x(N)) + \sum_{k=0}^{N-1} L(x(k), u(k), k)
- J = \varphi(x(t_f)) + \int_{t_0}^{t_f} L(x(t), u(t), t)\, dt
ハミルトニアン
- H(x,y,\lambda,k) = L(x,u,k)+\lambda^T f(x,u,k)
- H(x,y,\lambda,t) = L(x,u,t)+\lambda^T f(x,u,t)
オイラー・ラグランジュ方程式（最適制御の必要条件）
- \begin{cases} x(k+1) = f(x(k), u(k), k), \quad x(0)=x_0, \\ \lambda(k) = \left(\dfrac{\partial H}{\partial x}\right)^T (x(k), u(k), \lambda(k+1), k), \quad \lambda(N) = \left(\dfrac{\partial \varphi}{\partial x}\right)^T (x(N)), \\ \dfrac{\partial H}{\partial u}(x(k), u(k), \lambda(k+1), k)=0. \end{cases}
動的計画法
- 値関数
  - \left\{\begin{aligned} &V(x,k) = \min_{\{u(\ell)\}_{\ell=1}^{N-1}}\left(\varphi(x(N))+ \sum_{\ell=k}^{N-1} L(x(\ell), u(\ell), \ell)\right), \quad & x \in \mathbf{R}^n, k=0,1,\cdots, N,\\ &V(x, N) = \varphi(x), \quad & x \in \mathbf{R}^n. \end{aligned}\right.
  - V(x,t) = ...
- ベルマン方程式（（値関数が存在すれば）最適制御の十分条件）
  - \left\{\begin{aligned} &V(x,k) = \min_{u}(L(x,u,k) + V(f(x,u,k), k+1)), \quad & x\in \mathbf{R}^n, k = 0,1, \cdots, N-1\\ &V(x, N) = \varphi(x), \quad & x \in \mathbf{R}^n. \end{aligned}\right.
ベルマン方程式からオイラー・ラグランジュ方程式の導出
- 離散、連続の場合で導出します

モデル
- x(k+1) = Ax(k) + Bu(k), \quad k=0,1,\cdots, N
- \dot{x}(t) = Ax(t) + Bu(t), \quad t\in [t_0, t_f]
評価関数
- J = \dfrac{1}{2} x^T(N) S_f x(N) + \sum_{k=0}^{N-1} \dfrac{1}{2}(x^T(k) Q x(k)+u^T(k) R u(k))
- J = ...
ハミルトニアン
- H(x,y,\lambda) = \dfrac{1}{2}(x^T Q x+u^T R u) + \lambda^T(Ax+Bu)
- H(x,y,\lambda) = ...
オイラー・ラグランジュ方程式 \left\{\begin{aligned} & x(k+1) = Ax(k) + Bu(k), \\ & \quad x(0)=x_0, \\ & \lambda(k) = Qx(k) + A^T\lambda(k+1), \\ & \quad \lambda(N) = S_f(x(N)), \\ & u^T(k)R + \lambda^T(k+1)B=0. \end{aligned}\right.
- リッカチ方程式 \left\{\begin{aligned} S(N) &= S_f ,\\ S(k) &= Q+A^TS(k+1)A \\ &\quad -A^TS(k+1)B(R+B^TS(k+1)B)^{-1}B^TS(k+1)A , \quad k = N-1, N-2,\cdots, 0 \end{aligned}\right.
動的計画法
- ベルマン方程式 \left\{\begin{aligned} &V(x,k) = \min_{u}\left\{\dfrac{1}{2} (x^T Q x+u^T R u) + V(Ax+Bu, k+1)\right\}, \quad & x\in \mathbf{R}^n, k = 0,1, \cdots, N-1\\ &V(x, N) = \dfrac{1}{2}x^TS_f x \quad & x \in \mathbf{R}^n. \end{aligned}\right. これの解は, リッカチ方程式の解 S(k) を用いて V(x,k) = \dfrac{1}{2}x^TS(k)x と解ける

初期条件固定(さっき上げたやつ)
終端条件固定(x(N), x(t_f) を固定する)
1. 随伴変数の終端条件なくなる
初期状態自由
1. 随伴変数に初期条件が課される
等式拘束条件C(x(k), u(k), k)=0
1. C 同じ次元のラグランジュ乗数 \rho を導入し、ハミルトニアンを H(x,u,\lambda, \rho,k) = L(x,u,k) + \lambda^T f(x,u,k) + \rho^TC(x,u,k) としてオイラー・ラグランジュ方程式を導出すると, [u^T, \rho^T]^T を入力とした停留条件を得る
終端時刻自由
1. 離散の場合: 各 N について評価関数 J_N を求め, N に関して最小値を探索する
2. 連続の場合