[場所1E103(金曜日5限)]
HPに行く.
今日は
ヘッシアンが正の意味
復習をすると、ヘッシアン \det(H(a,b))>0 であるとすると、その臨界点では、極値をもち、f_{xx}(a,b)>0 であるとすると、極小点、f_{xx}(a,b)<0 とすると、極大点と
なります.これが、前回で紹介した定理です.
このヘッシアンが正条件が極値のための十分条件となるのは、2変数だけのことです.
関数が、ある臨界点で極値であるための”本当の”十分条件は、ヘッセ行列の固有値が全て正か全て負であることです.
つまり、固有値の符号が全て一致していることが極値のための十分条件です.
さらに、全て正であるなら、極小点であり、全て負であるなら極大点なのです.
2変数であれば、ヘッシアンは、ヘッセ行列の固有値の2個の積です.
(ちなみに、ヘッセ行列は実対称行列なので固有値はいつでも実数です.)
つまり、\kappa_1,\kappa_2 がヘッセ行列の固有値とすると、
\det(H(a,b))=\kappa_1\kappa_2
となります.
\kappa_1,\kappa_2 の符号が一致しているということを言い換えて、\kappa_1\kappa_2>0 という条件、つまり、\det(H(a,b))>0 がでてくるのです.
これが、前回の定理でした.\det(H(a,b))>0 かつ \kappa_1>0 であることが極小点であるための条件で、\det(H(a,b))>0 かつ \kappa_2<0 が極大点であるための条件となります.
どうして固有値の条件としないのか?という疑問については、極値のための条件が一つの
式でかけるという便利さと、固有値を求めるには2次方程式を解かなければならないので、それよりは、簡単に計算できる判定法として、行列式が正の条件を挙げているわけです.
f_{xx}(a,b)>0 の条件は?
さらに、\det(H(a,b))>0 であるとき、f_{xx}(a,b)>0 の条件は f_{yy}(a,b)>0 という条件と同じです.もし、f_{xx}(a,b), f_{yy}(a,b) の正負が一致しないとすると、\det(H(a,b))>0 の条件に反するからです.固有多項式を計算すると、
\det\begin{pmatrix}t-f_{xx}(a,b)&-f_{xy}(a,b)\\-f_{yx}(a,b)&t-f_{yy}(a,b)\end{pmatrix}=(t-f_{xx}(a,b))(t-f_{yy}(a,b))-f_{xy}(a,b)^2=t^2-(f_{xx}(a,b)+f_{yy}(a,b))t+f_{xx}(a,b)f_{yy}(a,b)-f_{xy}(a,b)^2
であり、高校の頃にやった、
2次方程式の解がどちらも正の場合に、方程式の係数の満たす条件を求めなさい.
という問題が生きてきます.
あのころは、何のためにそのような問題をやったのかわからなかったと思いますが、今、自然とその問題を考えることになります.
今、この固有多項式の解(つまり2つの固有値のこと)がどちらも正であるためには、y-切片が \det(H(a,b))=ad-b^2>0 ですから、2次関数の軸の条件 a+d>0が必要となります.これは、f_{xx}(a,b)+f_{yy}(a,b)>0 ということですから、上のことから f_{xx}(a,b)>0 がいえます.
つまり、\det(H(a,b))>0 なら、
f_{xx}(a,b)>0\Leftrightarrow f_{yy}(a,b)>0\Leftrightarrow f_{xx}(a,b)+f_{yy}(a,b)>0\Leftrightarrow \text{固有値がどちらも正}
ゆえに、f_{xx}(a,b) の正負によって、極小か極大かわかることになります.
3変数関数の場合
3変数関数の場合 w=f(x,y,z) が極値となるためには、臨界点でのヘッシアン(ヘッセ行列の行列式)の正条件はもはや十分条件ではありません.
ヘッセ行列の固有値が
極値問題で、ヘッシアンがゼロの場合を考えます.
極値問題その2
ここで扱う極値問題は、臨界点 (a,b) において、ヘッセ行列
H(a,b)=\begin{pmatrix}f_{xx}(a,b)&f_{xy}(a,b)\\f_{yx}(a,b)&f_{yy}(a,b)\end{pmatrix}
の行列式(ヘッシアンと呼ばれる)が 0 になっているものです.
ヘッシアンがゼロの臨界点のことをのことを、臨界点が退化しているといいます.そうでない場合、\det(H(a,b))>0 もしくは、\det(H(a,b))<0 の場合は、臨界点が非退化しているといいます.
非退化臨界点である場合は、臨界点の様子がよくわかります.
つまり、固有値が全て正であれば極小であるし、全て負であれば、極大です.
そのほかの場合は、極値ではありません.
退化した臨界点の場合(ヘッシアンがゼロ)
ここでは、退化した場合を考えます.
そのとき、ヘッシアンの行列のランクは2より小さいので、
ランクは1か0です.
ただ、3次近似以降を見て極値かどうかを判定するのは難しいです.
一般論はありますが、それをここで解説するには時間がかかりすぎます.
古典的な結果は幾つかあると思うので、興味のある人は、こちらの記事をみてください.
授業中に紹介した方法では、
極値であることを示すには、臨界点の周りである不等式を見つけること.
極値でないことを示すには、臨界点の周りで、正からも負からも近づく点列(または曲線)を作ること.
でした.復習すると、
f(x,y)=x^4+y^2+3y の場合
まず、臨界点を求めると、
f_x(x,y)=f_y(x,y)=0 とすると、解は、(x,y)=(0,-\frac{3}{2}) となります.
ヘッセ行列を計算すると、
\begin{pmatrix}0&0\\0&2\end{pmatrix}
となっており、ランクが1の行列となっています.
つまり、(0,-\frac{3}{2}) の周りでの2次近似は、ある方向では曲がっているが、ある方向では水平方向になっていることがわかります.
この場合、f(x,y) の(0,-\frac{3}{2}) での2次近似は、
f(x,y)=-\frac{9}{4}+(y+\frac{3}{2})^2+o(x^2+y^2)
となっており、y 方向には、下に凸に曲がっていることがわかります.x 方向には水平です.
3次近似以降で、x 方向で、
下に凸になっていれば、(0,-\frac{3}{2}) で極値であるし、 (*)
上に凸であれば、(0,-\frac{3}{2}) で極値ではない、また、 (**)
そもそも極大でも極小でなければ、(0,-\frac{3}{2}) では極値ではない.(**)
今は、3次近似は、全ての3回偏微分はゼロ f_{xxx}(0,-\frac{3}{2})=f_{xxy}(0,-\frac{3}{2})=\cdots=0 なので、2次近似は3次近似にもなります.
よって、4次近似を考えますと、その近似関数そのものがもとの関数になって、
f(x,y)=
となります.4次近似において x^4 という下に凸の関数が出てきましたので、この臨界点が下に凸(つまり極小点)になっています.上の (*) の条件が成り立っているわけですね.
実際、証明するには、
f(x,y)+\frac{9}{4}=(y+\frac{3}{2})^2+x^4\ge 0 となり、
(y+\frac{3}{2})^2+x^4=0
となるのは、y=-\frac{3}{2} かつ x=0 のときだけです.
これは、この点で極値であることを示しています.
(**) のパターンとしては、
-x^4+y^2+3y という関数とすると、4次近似において -x^4 という上に凸の関数が出ますので、極値でないことがわかります.授業中に説明した鞍点(馬の背)ということになります.
(***) のパターンとしては、
x^3+y^2+3y という関数だとすると、3次近似において、x^3 は原点において、極大でも極小でもないので、結果として、x^3+y^2+3y は (0,-\frac{3}{2}) において極小での極大でもありません.また、鞍点でもありません.
x^3+y^3+x^2+2xy+y^2 の場合
この場合もやると、(0,0) において退化した臨界点が現れます.
この関数が (0,0) において極値でないことを示すには、(0,0) の近くで、正で近づく点列、また負で近づく点列を見つければよいでしょう.
例えば、 x=0 として、f(0,y)=y^3+y^2=y^2(y+1) となりますが、f(0,y) は原点にいくらでも近く正の数をとります.
次の直線 (y=-x)と楕円 (f(x,y)=x^2+y^2-xy+x+y=0) は、$x^3+y^3+x^2 +2xy+y^2=0$ を満たすものです.
ここで、 y=-x より右側は f(x,y)>0 であり、この楕円の中も f(x,y)>0$ となります.
それ以外の点では、負の数です.
よって、原点のいくらでも近くに、正の数と負の数が存在するので、原点でこの関数は
極値ではないということになります.
陰関数の定理
陰関数の定理については、去年の解説がこちらにありますのでそちらを参照してください.
ただ、一般的な形で書かれています.
HPに行く.
今日は
- 極値問題その2と
- 陰関数の定理を行いました.
まず、偏微分が両方消えている点のことを臨界点といいます.
極値の候補 f_x(a,b)=f_y(a,b)=0 の点のことです.
つまり、接平面が xy 平面に平行である場合です.
この条件だけでは、微分が消えているだけなので、
極値かどうかはわかりません.ただ、極値であれば少なくともこの条件が成り立つ必要があります.
ここでは、f_x(a,b)=f_y(a,b)=0 という点といわず、臨界点という用語を使っていきたいと思います.
ヘッシアンが正の意味
復習をすると、ヘッシアン \det(H(a,b))>0 であるとすると、その臨界点では、極値をもち、f_{xx}(a,b)>0 であるとすると、極小点、f_{xx}(a,b)<0 とすると、極大点と
なります.これが、前回で紹介した定理です.
このヘッシアンが正条件が極値のための十分条件となるのは、2変数だけのことです.
関数が、ある臨界点で極値であるための”本当の”十分条件は、ヘッセ行列の固有値が全て正か全て負であることです.
つまり、固有値の符号が全て一致していることが極値のための十分条件です.
さらに、全て正であるなら、極小点であり、全て負であるなら極大点なのです.
2変数であれば、ヘッシアンは、ヘッセ行列の固有値の2個の積です.
(ちなみに、ヘッセ行列は実対称行列なので固有値はいつでも実数です.)
つまり、\kappa_1,\kappa_2 がヘッセ行列の固有値とすると、
\det(H(a,b))=\kappa_1\kappa_2
となります.
\kappa_1,\kappa_2 の符号が一致しているということを言い換えて、\kappa_1\kappa_2>0 という条件、つまり、\det(H(a,b))>0 がでてくるのです.
これが、前回の定理でした.\det(H(a,b))>0 かつ \kappa_1>0 であることが極小点であるための条件で、\det(H(a,b))>0 かつ \kappa_2<0 が極大点であるための条件となります.
どうして固有値の条件としないのか?という疑問については、極値のための条件が一つの
式でかけるという便利さと、固有値を求めるには2次方程式を解かなければならないので、それよりは、簡単に計算できる判定法として、行列式が正の条件を挙げているわけです.
f_{xx}(a,b)>0 の条件は?
さらに、\det(H(a,b))>0 であるとき、f_{xx}(a,b)>0 の条件は f_{yy}(a,b)>0 という条件と同じです.もし、f_{xx}(a,b), f_{yy}(a,b) の正負が一致しないとすると、\det(H(a,b))>0 の条件に反するからです.固有多項式を計算すると、
\det\begin{pmatrix}t-f_{xx}(a,b)&-f_{xy}(a,b)\\-f_{yx}(a,b)&t-f_{yy}(a,b)\end{pmatrix}=(t-f_{xx}(a,b))(t-f_{yy}(a,b))-f_{xy}(a,b)^2=t^2-(f_{xx}(a,b)+f_{yy}(a,b))t+f_{xx}(a,b)f_{yy}(a,b)-f_{xy}(a,b)^2
であり、高校の頃にやった、
2次方程式の解がどちらも正の場合に、方程式の係数の満たす条件を求めなさい.
という問題が生きてきます.
あのころは、何のためにそのような問題をやったのかわからなかったと思いますが、今、自然とその問題を考えることになります.
今、この固有多項式の解(つまり2つの固有値のこと)がどちらも正であるためには、y-切片が \det(H(a,b))=ad-b^2>0 ですから、2次関数の軸の条件 a+d>0が必要となります.これは、f_{xx}(a,b)+f_{yy}(a,b)>0 ということですから、上のことから f_{xx}(a,b)>0 がいえます.
つまり、\det(H(a,b))>0 なら、
f_{xx}(a,b)>0\Leftrightarrow f_{yy}(a,b)>0\Leftrightarrow f_{xx}(a,b)+f_{yy}(a,b)>0\Leftrightarrow \text{固有値がどちらも正}
ゆえに、f_{xx}(a,b) の正負によって、極小か極大かわかることになります.
3変数関数の場合
3変数関数の場合 w=f(x,y,z) が極値となるためには、臨界点でのヘッシアン(ヘッセ行列の行列式)の正条件はもはや十分条件ではありません.
ヘッセ行列の固有値が
正負負
としても、ヘッシアンは正になりますが、全ての固有値が正になるわけではないので
極値とはなりません.つまり、この場合、ヘッシアンが正である条件は必要条件でも十分条件でもありません.必要条件でもないというのは、0 でも極大点となる場合がありますし、極大点であれば、固有値は全て負なので、ヘッシアンは負です.
極値問題で、ヘッシアンがゼロの場合を考えます.
極値問題その2
ここで扱う極値問題は、臨界点 (a,b) において、ヘッセ行列
H(a,b)=\begin{pmatrix}f_{xx}(a,b)&f_{xy}(a,b)\\f_{yx}(a,b)&f_{yy}(a,b)\end{pmatrix}
の行列式(ヘッシアンと呼ばれる)が 0 になっているものです.
ヘッシアンがゼロの臨界点のことをのことを、臨界点が退化しているといいます.そうでない場合、\det(H(a,b))>0 もしくは、\det(H(a,b))<0 の場合は、臨界点が非退化しているといいます.
非退化臨界点である場合は、臨界点の様子がよくわかります.
つまり、固有値が全て正であれば極小であるし、全て負であれば、極大です.
そのほかの場合は、極値ではありません.
退化した臨界点の場合(ヘッシアンがゼロ)
ここでは、退化した場合を考えます.
そのとき、ヘッシアンの行列のランクは2より小さいので、
ランクは1か0です.
ヘッセ行列のランクが1の場合は、2次近似が、
f(x,y)=f(a,b)+\frac{1}{2}(\alpha h+\beta k)^2+...
となるような場合で、典型的な例は、z=x^2 と片方の2次式しかない場合です.
これは、 下のような折り紙を曲げるような形です.この、一番下の点が臨界点です.
この点は、極値ではありません.その点の近くで、水平になっている部分があるからです.
この点は、極値ではありません.その点の近くで、水平になっている部分があるからです.
つまり、2次近似の曲がり方が水平方向の部分が1次元あります.
この水平方向での曲がり方は、3次近似以降の曲がり方を決めなければなりません.
それ以外の方向では、曲がり方が上に凸か下に凸となっています.
ヘッセ行列のランクが0の場合は、2次近似が、
となって、2次近似が平面になっています.つまり、3次近似以降によってその凹凸が決められます.この水平方向での曲がり方は、3次近似以降の曲がり方を決めなければなりません.
それ以外の方向では、曲がり方が上に凸か下に凸となっています.
ヘッセ行列のランクが0の場合は、2次近似が、
f(x,y)=f(a,b)+...
ただ、3次近似以降を見て極値かどうかを判定するのは難しいです.
一般論はありますが、それをここで解説するには時間がかかりすぎます.
古典的な結果は幾つかあると思うので、興味のある人は、こちらの記事をみてください.
授業中に紹介した方法では、
極値であることを示すには、臨界点の周りである不等式を見つけること.
極値でないことを示すには、臨界点の周りで、正からも負からも近づく点列(または曲線)を作ること.
でした.復習すると、
f(x,y)=x^4+y^2+3y の場合
まず、臨界点を求めると、
f_x(x,y)=f_y(x,y)=0 とすると、解は、(x,y)=(0,-\frac{3}{2}) となります.
ヘッセ行列を計算すると、
\begin{pmatrix}0&0\\0&2\end{pmatrix}
となっており、ランクが1の行列となっています.
つまり、(0,-\frac{3}{2}) の周りでの2次近似は、ある方向では曲がっているが、ある方向では水平方向になっていることがわかります.
この場合、f(x,y) の(0,-\frac{3}{2}) での2次近似は、
f(x,y)=-\frac{9}{4}+(y+\frac{3}{2})^2+o(x^2+y^2)
となっており、y 方向には、下に凸に曲がっていることがわかります.x 方向には水平です.
3次近似以降で、x 方向で、
下に凸になっていれば、(0,-\frac{3}{2}) で極値であるし、 (*)
上に凸であれば、(0,-\frac{3}{2}) で極値ではない、また、 (**)
そもそも極大でも極小でなければ、(0,-\frac{3}{2}) では極値ではない.(**)
今は、3次近似は、全ての3回偏微分はゼロ f_{xxx}(0,-\frac{3}{2})=f_{xxy}(0,-\frac{3}{2})=\cdots=0 なので、2次近似は3次近似にもなります.
よって、4次近似を考えますと、その近似関数そのものがもとの関数になって、
f(x,y)=
となります.4次近似において x^4 という下に凸の関数が出てきましたので、この臨界点が下に凸(つまり極小点)になっています.上の (*) の条件が成り立っているわけですね.
f(x,y)+\frac{9}{4}=(y+\frac{3}{2})^2+x^4\ge 0 となり、
(y+\frac{3}{2})^2+x^4=0
となるのは、y=-\frac{3}{2} かつ x=0 のときだけです.
これは、この点で極値であることを示しています.
(**) のパターンとしては、
-x^4+y^2+3y という関数とすると、4次近似において -x^4 という上に凸の関数が出ますので、極値でないことがわかります.授業中に説明した鞍点(馬の背)ということになります.
(***) のパターンとしては、
x^3+y^2+3y という関数だとすると、3次近似において、x^3 は原点において、極大でも極小でもないので、結果として、x^3+y^2+3y は (0,-\frac{3}{2}) において極小での極大でもありません.また、鞍点でもありません.
x^3+y^3+x^2+2xy+y^2 の場合
この場合もやると、(0,0) において退化した臨界点が現れます.
この関数が (0,0) において極値でないことを示すには、(0,0) の近くで、正で近づく点列、また負で近づく点列を見つければよいでしょう.
例えば、 x=0 として、f(0,y)=y^3+y^2=y^2(y+1) となりますが、f(0,y) は原点にいくらでも近く正の数をとります.
次の直線 (y=-x)と楕円 (f(x,y)=x^2+y^2-xy+x+y=0) は、$x^3+y^3+x^2 +2xy+y^2=0$ を満たすものです.
ここで、 y=-x より右側は f(x,y)>0 であり、この楕円の中も f(x,y)>0$ となります.
それ以外の点では、負の数です.
ですので、この負の領域から原点に近づけば、いつも負の値のまま原点に近づくことができます.
極値ではないということになります.
陰関数の定理
陰関数の定理については、去年の解説がこちらにありますのでそちらを参照してください.
ただ、一般的な形で書かれています.
0 件のコメント:
コメントを投稿