最適レギュレータ 松尾研究室資料
第 最適レギュレータ 節時不変型無限時間最適レギュレータ 状態フィードバックの可能な場合の無限時間問題における最適レギュレータについて確定系について説明する. ここで, レギュレータとは状態量をゼロにするようなコントローラのことである. なぜ, 無限時間問題のみを述べるかという理由は以下のとおりである. 有限時間の最適レギュレータ問題の場合の最適フィードバックゲインは微分方程式の解から構成される時間関数として表現される. この微分方程式は到達時刻より初期時刻に向かって後ろ向きに解かなければならない. この計算は前もってオフラインで解いておいて, メモリに記憶しておく必要があり, 時間ごとにゲインを計算するために, これを呼び出してきては計算を行わなければならない. 余談であるが筆者などは, めんどうくさいので, 微分方程式はこれまで一度も計算したことがない. さらに, このような面倒くささの割にはロバスト性などのメリットに乏しい. それに対して, 無限時間問題の場合にはフィードバックゲインは定数になり, また円条件とよばれるロバスト性が保証されている. 節確定系の最適レギュレータ初期値応答の最小化 確定系の場合の制御対象は状態方程式で書くと次式のようになる. 確定系と呼んでいるのは, 入力や出力に確率的な雑音がはいらないことを強調するためである. また, 状態はすべて測定可能で, 入力信号の合成のために利用可能であるとする. ここで, は制御量し, は観測量出力とする. 制御量とは, 入力を調整することによりなるべく小さくなるようにすべき信号のことをいう. 特に, 制御量を次式のようにとった場合を考えよう.
第最適レギュレータ ただし, で, とする. 上式は状態の一部と入力の両方をなるべく小さくしたいことを意味している. ここで, 信号が小さいというのをどのように評価したらよいのか問題となってくる. 大小の判断をするためには, 信号の大きさというものを正のスカラー量で評価する必要がある. の瞬時値の大きさは普通次のようなベクトルノルムで考えることができる. さらに, 時間関数全体の大きさをとるためにを次のように積分し, この値を最小にする入力を合成することを目的とするのが最適レギュレータである. ここで, 上式を評価関数というが, これは, 出力のゼロへの収束を効率的に, かつ, 入力も になる ことなく効率的なものにしたい, という目的がこめられていることに注意する. とくに, 入力に関する制約 がない場合には入力は無限大値を許す なものとなる. これを というが, この点につ いては説明を省略する. さて, 評価関数 を最小にする最適制御入力は次式で与えられる. ここで, は次の代数方程式の半正定解とする. また, このときの評価関数の最小値は次のようになる. さらに, 最適レギュレータによる閉ループ系は次のようになる. これらの導出はもともとは, 最大原理,, 変分法によりできるが, ここでは線形フィードバック が, すべての初期値に対して評価を最小にするのはどういう場合であるかについて, 簡単な説明を行う. ただし, は安定化フィードバック, つまり, は安定とする. をに代入すると, 次式のようになる. ここで, 初期値応答は次式のようになる. これをに代入すると次式となる.
節確定系の最適レギュレータ初期値応答の最小化 を方程式を用いてかくと次のようになる. ここで, すべて について を最小化するかわりに, を平均が で分散が単位行列, つまり, であるような確率変数とみなして, 評価関数 の期待値 を最小にする フィードバックゲインを求めることにする. を計算すると次式のようになる. ただし, は正方行列 の対角和であり, これは次の性質をもっている. このとき問題は, を の制約のもとに最小化するような を求める問題に帰着されたこ とになる. そこで, 関数 を, とおき, 未定係数法を用いる. ただし, が未定係数であり,, なる を求めることになる. つまり, より を求めると, 次式のようになる. ここで, 導出されたフィードバックゲインにより閉ループが安定化されているかどうか確かめておこう. を変形すると次式のようになる. このことから, の解 で正定なものがあれば, の安定定理より は安定になる ことがわかる. もっと, を半正定まで緩めた細かい話をするとつぎのようになる. まず, 次の 方程式の安定性について考えることにする. 上式に対して次のことがいえる.
第最適レギュレータ が安定ならば任意のに対してなるが唯一存在する. あるに対してなる有限のが存在したとする. このとき, が可検出であるならばは安定となる. で可観測ならば, である. としたときの方程式の解をそれぞれ, とおく. このとき, ならば. の証明の解は次式で与えられることから明らかである. なお, このことはの両辺をで積分することによりでてくる. の証明に対して次式が成立する. 上式の両辺をで積分すると次のようになる. ここで, に不安定極があるとすると, は可検出であるので, 上式右辺第項はのとき発散してしまうが, 上式は任意のに対して成立しなければならないことから, は有界値では存在しなくなる. このことから, は安定行列でなければならないことになる. の証明可観測ならば, 任意のに対して, 次式が成立する. の解表現からは明らか. の証明に対して次式が成り立つ. この式の解表現より がいえる. さらに, 行列 に対して次式が成り立つとする.
節確定系の最適レギュレータ初期値応答の最小化 このとき, が検出可能であれば, 任意の適当な行列 に対して, も検出可能となること がいえる. これはつぎのようにして示すことができる. いま, が検出可能でないと仮定する. このとき, ある複素数 とベクトルに対して, 次式が成立する. の両辺に左から, 右からをかけると, の正定値性から となることから, 次式が成立しなければならないことになる. これは, の可検出性に矛盾する. 以上のことから, の行列 は安定となることがわかる. また, が可安定で が可検出のときには, 方程式 の半正定解が唯一存在することが知られている ( このの最後 で 方程式の解の存在条件について説明する ). このようにして上記では, 問題を変更して を最小にするフィードバックゲインを求めたが, なる が本来の なる の最小化問題においてどういう意味をもつかについて説明しておこう. 今, を任意の安定化フィードバックとし, その評価関数をとすると, 次式のように表される. そこで, から をひき, を用いると, 次式が成立する. は安定行列であることから, 上式は が半正定行列であることがわかる. このことから, 任意の初期値 に対して であることがわかる. ただし, なるフィードバックゲインによる評価を とおいた. この節の最後に参考のため, 各々の に対する本来の なる の最小化問題の解を与える. 解 は なものになる. システム において, は虚軸上にゼロ点を持たず, は可安定, はフルランク, は正定対称行列とする. また, 初期値を このとき, 次式を満足するようなが存在する. ここで, 次の正準方程式 ( 正準方程式については後述する ) を定義する.
第最適レギュレータ 入力 を と定義すると, は制御対象に入力を加えたときのシステムの応答を表している. また, ととは方程式の解を用いて表すと, 次式のようになる. なぜならば, 上式の右辺を微分すると, つぎのように変形できるからである. したがって, は次式の解となることがわかる. これから, であることがわかる. ここで, 初期値が, 入力がのときの評価関数を特に と書くことにすると, が次式の意味での最適入力となることを以下のようにして証明できる. ただし, は初期値が, 入力がのときのシステムの状態変数である. また, は次式のようなノルムが有界となる可積分関数のすべての集合であり, 乗可積分空間といわれる. のとき, であるので, となることに注意するこれをの定理という. 変数とシステムの状態変数の内積の微分値は次のようになる. いま, 初期値が, 入力がのときの制御量を, 特にと表すことにすると, 次式が成立する.
節時不変無限時間最適レギュレータ このつの式をで積分すると, 次式のようになる. 上式から次式が成り立つ. ここで, 次式が成り立つことに注意する. これから, となり, がわかる. したがって, すべてのに対して, となることから, 次式がわかる. このときの閉ループ系のダイナミクスはつぎのように表すことができる. 節時変型有限時間最適レギュレータ節項時変型線形状態方程式の解節項変分的最適レギュレータの導出節項最適レギュレータのフィードバック則と節時不変無限時間最適レギュレータ節項代数方程式 微分方程式