DVIOUT - PDF Free Download

最適レギュレータ松尾研究室資料

第最適レギュレータ節時不変型無限時間最適レギュレータ状態フィードバックの可能な場合の無限時間問題における最適レギュレータについて確定系について説明する. ここで, レギュレータとは状態量をゼロにするようなコントローラのことである. なぜ, 無限時間問題のみを述べるかという理由は以下のとおりである. 有限時間の最適レギュレータ問題の場合の最適フィードバックゲインは微分方程式の解から構成される時間関数として表現される. この微分方程式は到達時刻より初期時刻に向かって後ろ向きに解かなければならない. この計算は前もってオフラインで解いておいて, メモリに記憶しておく必要があり, 時間ごとにゲインを計算するために, これを呼び出してきては計算を行わなければならない. 余談であるが筆者などは, めんどうくさいので, 微分方程式はこれまで一度も計算したことがない. さらに, このような面倒くささの割にはロバスト性などのメリットに乏しい. それに対して, 無限時間問題の場合にはフィードバックゲインは定数になり, また円条件とよばれるロバスト性が保証されている. 節確定系の最適レギュレータ初期値応答の最小化確定系の場合の制御対象は状態方程式で書くと次式のようになる. 確定系と呼んでいるのは, 入力や出力に確率的な雑音がはいらないことを強調するためである. また, 状態はすべて測定可能で, 入力信号の合成のために利用可能であるとする. ここで, は制御量し, は観測量出力とする. 制御量とは, 入力を調整することによりなるべく小さくなるようにすべき信号のことをいう. 特に, 制御量を次式のようにとった場合を考えよう.

第最適レギュレータただし, で, とする. 上式は状態の一部と入力の両方をなるべく小さくしたいことを意味している. ここで, 信号が小さいというのをどのように評価したらよいのか問題となってくる. 大小の判断をするためには, 信号の大きさというものを正のスカラー量で評価する必要がある. の瞬時値の大きさは普通次のようなベクトルノルムで考えることができる. さらに, 時間関数全体の大きさをとるためにを次のように積分し, この値を最小にする入力を合成することを目的とするのが最適レギュレータである. ここで, 上式を評価関数というが, これは, 出力のゼロへの収束を効率的に, かつ, 入力もになることなく効率的なものにしたい, という目的がこめられていることに注意する. とくに, 入力に関する制約がない場合には入力は無限大値を許すなものとなる. これをというが, この点については説明を省略する. さて, 評価関数を最小にする最適制御入力は次式で与えられる. ここで, は次の代数方程式の半正定解とする. また, このときの評価関数の最小値は次のようになる. さらに, 最適レギュレータによる閉ループ系は次のようになる. これらの導出はもともとは, 最大原理,, 変分法によりできるが, ここでは線形フィードバックが, すべての初期値に対して評価を最小にするのはどういう場合であるかについて, 簡単な説明を行う. ただし, は安定化フィードバック, つまり, は安定とする. をに代入すると, 次式のようになる. ここで, 初期値応答は次式のようになる. これをに代入すると次式となる.

節確定系の最適レギュレータ初期値応答の最小化を方程式を用いてかくと次のようになる. ここで, すべてについてを最小化するかわりに, を平均がで分散が単位行列, つまり, であるような確率変数とみなして, 評価関数の期待値を最小にするフィードバックゲインを求めることにする. を計算すると次式のようになる. ただし, は正方行列の対角和であり, これは次の性質をもっている. このとき問題は, をの制約のもとに最小化するようなを求める問題に帰着されたことになる. そこで, 関数を, とおき, 未定係数法を用いる. ただし, が未定係数であり,, なるを求めることになる. つまり, よりを求めると, 次式のようになる. ここで, 導出されたフィードバックゲインにより閉ループが安定化されているかどうか確かめておこう. を変形すると次式のようになる. このことから, の解で正定なものがあれば, の安定定理よりは安定になることがわかる. もっと, を半正定まで緩めた細かい話をするとつぎのようになる. まず, 次の方程式の安定性について考えることにする. 上式に対して次のことがいえる.

第最適レギュレータが安定ならば任意のに対してなるが唯一存在する. あるに対してなる有限のが存在したとする. このとき, が可検出であるならばは安定となる. で可観測ならば, である. としたときの方程式の解をそれぞれ, とおく. このとき, ならば. の証明の解は次式で与えられることから明らかである. なお, このことはの両辺をで積分することによりでてくる. の証明に対して次式が成立する. 上式の両辺をで積分すると次のようになる. ここで, に不安定極があるとすると, は可検出であるので, 上式右辺第項はのとき発散してしまうが, 上式は任意のに対して成立しなければならないことから, は有界値では存在しなくなる. このことから, は安定行列でなければならないことになる. の証明可観測ならば, 任意のに対して, 次式が成立する. の解表現からは明らか. の証明に対して次式が成り立つ. この式の解表現よりがいえる. さらに, 行列に対して次式が成り立つとする.

節確定系の最適レギュレータ初期値応答の最小化このとき, が検出可能であれば, 任意の適当な行列に対して, も検出可能となることがいえる. これはつぎのようにして示すことができる. いま, が検出可能でないと仮定する. このとき, ある複素数とベクトルに対して, 次式が成立する. の両辺に左から, 右からをかけると, の正定値性からとなることから, 次式が成立しなければならないことになる. これは, の可検出性に矛盾する. 以上のことから, の行列は安定となることがわかる. また, が可安定でが可検出のときには, 方程式の半正定解が唯一存在することが知られている ( このの最後で方程式の解の存在条件について説明する ). このようにして上記では, 問題を変更してを最小にするフィードバックゲインを求めたが, なるが本来のなるの最小化問題においてどういう意味をもつかについて説明しておこう. 今, を任意の安定化フィードバックとし, その評価関数をとすると, 次式のように表される. そこで, からをひき, を用いると, 次式が成立する. は安定行列であることから, 上式はが半正定行列であることがわかる. このことから, 任意の初期値に対してであることがわかる. ただし, なるフィードバックゲインによる評価をとおいた. この節の最後に参考のため, 各々のに対する本来のなるの最小化問題の解を与える. 解はなものになる. システムにおいて, は虚軸上にゼロ点を持たず, は可安定, はフルランク, は正定対称行列とする. また, 初期値をこのとき, 次式を満足するようなが存在する. ここで, 次の正準方程式 ( 正準方程式については後述する ) を定義する.

第最適レギュレータ入力をと定義すると, は制御対象に入力を加えたときのシステムの応答を表している. また, ととは方程式の解を用いて表すと, 次式のようになる. なぜならば, 上式の右辺を微分すると, つぎのように変形できるからである. したがって, は次式の解となることがわかる. これから, であることがわかる. ここで, 初期値が, 入力がのときの評価関数を特にと書くことにすると, が次式の意味での最適入力となることを以下のようにして証明できる. ただし, は初期値が, 入力がのときのシステムの状態変数である. また, は次式のようなノルムが有界となる可積分関数のすべての集合であり, 乗可積分空間といわれる. のとき, であるので, となることに注意するこれをの定理という. 変数とシステムの状態変数の内積の微分値は次のようになる. いま, 初期値が, 入力がのときの制御量を, 特にと表すことにすると, 次式が成立する.

節時不変無限時間最適レギュレータこのつの式をで積分すると, 次式のようになる. 上式から次式が成り立つ. ここで, 次式が成り立つことに注意する. これから, となり, がわかる. したがって, すべてのに対して, となることから, 次式がわかる. このときの閉ループ系のダイナミクスはつぎのように表すことができる. 節時変型有限時間最適レギュレータ節項時変型線形状態方程式の解節項変分的最適レギュレータの導出節項最適レギュレータのフィードバック則と節時不変無限時間最適レギュレータ節項代数方程式微分方程式