Processing math: 0%

2020年7月20日月曜日

積分と極限の順序交換定理(アルゼラの定理)

積分と極限の交換定理について書きます。
積分と極限の交換とは
\lim_{n\to\infty}\int_a^bf_n(x)dx=\int_a^b\lim_{n\to\infty}f_n(x)dx
が成り立つことを言います。

微積分で最初に習う積分と極限の交換のための(十分)条件は、
おそらく、その関数列が一様収束する場合だと思いますが、
関数列が一様収束しなくても積分と極限の交換が成り立つ場合がありますので
下で紹介し、証明します。

一様収束する関数列の積分と極限の順序交換については、
このブログの2016年の微積分II演習のページ(リンク
に書いていますのでそちらを参照してください。
一様収束の定義もそちらを参照してください。

このページでは基本、大学1年生向け微積分を扱いますので
ルベーグ積分は仮定せずに、リーマン積分の範疇だけで話を進めます。
ルベーグ積分を学んだあとであれば、これらの積分と極限の交換定理は
ルベーグの収束定理から直ちに導かれます。

具体的には下の定理を証明します。
この証明は、小平邦彦著の「解析入門」(岩波基礎数学)の第5章にあり、
「解析入門」によると、Hausdorffの1927年の論文(Beweis eines Satzes von Arzelà)
が元だそうです。(私は論文を読んだわけではありません。)
また、この定理は、解析学のアスコリ=アルゼラの定理(wikipedia)としても一般化されます。

アルゼラの定理
定理(積分と極限の順序交換定理(アルゼラの定理))
f_n を区間 I=[a,b] で定義された連続関数列とし、ある実数 M>0 が存在して、任意の n\in {\mathbb N}x\in I に対して、|f_n(x)|\le M が成り立つとする。この関数列は I 上で f(x) に各点収束し、(a,b) で連続であるとする。このとき以下の積分と極限の順序交換が成り立つ。
\lim_{n\to \infty}\int_a^bf_n(x)dx=\int_a^b\lim_{n\to \infty}f_n(x)dx

「解析入門」の本文では、f(x) の連続性は、(a,b) ではなく、[a,b] となっていますが
下の証明にあるように、(a,b) でだけの連続であれば成り立ちます。

リーマン積分可能であれば、連続である必要もないのですが、
リーマン可積分の条件などを証明途中で使うのは面倒なので連続関数の積分のみを用いて証明します。もし、不連続点をさらに多く含むような場合を考えたい場合は、上に書いたようにルベーグ積分を勉強して理解することで全て解決されます。

定理の中に記述されている
「ある実数 M>0 が存在して、任意の n\in {\mathbb N}x\in Iに対して、
|f_n(x)|\le M が成り立つ」ことを一様有界といいます。
では証明していきます。
(「解析入門」とは、文字など適宜変えた部分がありますのでご了承ください。)

また、証明は少々ですが長いので読む覚悟のある人以外は証明の内容は理解せず、
定理の内容だけ理解して、下の方にある例にまでスキップして使い方だけ
学んでもよいかと思います。

(証明)
|\int_a^bf_n(x)dx-\int_a^bf(x)dx|\le \int_a^b|f_n(x)-f(x)|dx
から、g_n(x)=|f_n(x)-f(x)| とおいたとき、
\lim_{n\to\infty}\int_a^bg_n(x)dx=0\cdots (\ast)
であることを証明すればよいことになります。

f_n(x)は一様有界なので、あるMが存在して、|f_n(x)|<M が成り立ちます。
また、各点の極限をとることで、|f(x)|\le Mが成り立つので、
|g_n(x)|\le |f_n(x)|+|f(x)|\le  2M が成り立ちます。
f_n(x) は各点収束するので、任意の x に対して g_n(x)\to 0 となります。

各点a\le x\le b に対して、数列 g_n(x),g_{n+1}(x),\cdots の上限を
s_n(x) とします。つまり、
s_n(x)=\underset{m\ge n}{\sup}g_m(x)
であり、a\le x\le b に対して
2M\ge s_1(x)\ge s_2(x)\cdots s_n(x)\ge \cdots
したがって、g_n(x)\to 0であるから、
\lim_{n\to \infty}s_n(x)=\limsup_{n\to \infty}g_n(x)=0\cdots(\dagger)
が成り立ちます。

ここで、s_n(x) が連続である場合には下のDiniの定理により、
s_n(x)\to 0は、a\le x\le b0を与える関数に
一様収束し、\lim_{n\to\infty}\int_a^bs_n(x)dx=0 となります。

そこで、s_n(x) が連続とは限らない場合を考えます。
ここで、
S_n=\underset{h\le s_n}{\sup}\int_a^bh(x)dx
とします。
この上限は、任意のx\in I に対して、h(x)\le s_n(x) を満たすような
連続関数全体に対して上限を取ることを意味します。
そのような h(x) に対して、
\int_a^bh(x)dx\le \int_a^b2Mdx=2M(b-a) であるから、
2M(b-a)\ge S_1\ge S_2\ge \cdots \cdots \ge S_n\ge \cdots
であり、g_n(x)\le s_n(x) であるから、
0\le \int_a^bg_n(x)dx\le S_n

よって、S_n\to 0であることを示せば (\ast) が成り立つことになります。
任意の正数 \epsilon>0 に対して、\epsilon_n=\epsilon/2^nと定義します。
このとき、
\int_a^bh_n(x)dx> S_n-\epsilon_n\cdots (\ast\ast)
となる連続関数 h_n(x)
h_n\le s_n となるものが存在します。

ここで、k_n(x)=\min\{h_1(x),\cdots ,h_n(x)\}
とおきます。このとき、下の補題を用いれば、k_n(x) も連続関数になります。

そして、明らかに、k_1(x)\ge k_2(x)\ge \cdots \ge k_n(x)\ge \cdots
かつ
k_n(x)\le h_n(x)\le s_n(x) が成り立ち、これから、
\int_a^bk_n(x)dx>S_n-\epsilon_1-\epsilon_2-\cdots-\epsilon_n
が成り立ちます。

実際、
\mu_n(x)=\max\{k_{n-1}(x),h_n(x)\} と定義します。
このとき、\mu_n(x)I上で連続であり、
(\max\minが連続性を保持すること、つまり、f_1(x)f_2(x)
連続なら、\max\{f_1(x),f_2(x)\}\min\{f_1(x),f_2(x)\} が連続であること
は、このページの下の方にある補題からわかります)

\min\{\xi,\eta\}+\max\{\xi,\eta\}=\xi+\eta であるから、
k_n(x)+\mu_n(x)=k_{n-1}(x)+h_n(x)
であり、
\int_a^bk_n(x)dx=\int_a^bk_{n-1}(x)dx+\int_a^bh_n(x)dx-\int_a^b\mu_n(x)dx
ここで、
k_{n-1}(x)\le s_{n-1}(x)
かつ
h_n(x)\le s_n(x)\le s_{n-1}(x)
であるから、
\mu_n(x)\le s_{n-1}(x)
であり、したがって、
\int_a^b\mu_n(x)dx\le S_{n-1} となります。
よって、この不等式と不等式 (\ast\ast) を用いれば、
\int_a^bk_n(x)dx>\int_a^bk_{n-1}(x)dx+S_n-\epsilon_n-S_{n-1}
が成り立ちます。
\int_a^bk_1(x)dx=\int_a^bh_1(x)dx>S_1-\epsilon_1であるから、
この不等式を繰り返すことで、
\int_a^bk_n(x)dx>(S_n-\epsilon_n-S_{n-1})+(S_{n-1}-\epsilon_{n-1}-S_{n-2})+\cdots+(S_{2}-\epsilon_2-S_{1})+\int_a^bk_1(x)dx>S_n-\epsilon_1-\epsilon_2-\cdots-\epsilon_n
となります。

よって、\epsilon_1+\epsilon_2+\cdots+\epsilon_n<\epsilonであるから、
\int_a^bk_n(x)dx>S_n-\epsilon が成り立ちます。

ここで、k_n(x) は連続関数列であり、
k_1(x)\ge k_2(x)\ge k_2(x)\ge \cdots \ge k_n(x)\ge\cdots
であり、0\le k_n(x)\le s_n(x) であるから、
(\dagger) において各 a\le x\le b に対して、k_n(x)\to 0 となります。
つまり、k_n(x) は単調非増加な連続関数であり、恒等的に 0 となる関数に
各点収束するから、Diniの定理から、k_n(x) は 一様収束し、
\lim_{n\to \infty}\int_a^bk_n(x)dx=0 となります。
よって、\lim_{n\to\infty}S_n\le \epsilon が成り立つので、
\lim_{n\to\infty}S_n=0
が成り立ちます。\Box

Diniの定理
定理(Diniの定理)
閉区間 [a,b] において、連続な関数 f_n(x) を項とする単調非増加な
関数列とする。つまり、a\le x\le b において、
f_1(x)\ge f_2(x)\ge \cdots \ge f_n(x)\ge\cdots
となる関数列とし、連続関数 f(x) に収束するとする。
このとき、f_n(x)[a,b]f(x) に一様収束する。

(証明)
g_n(x)=|f_n(x)-f(x)| とするとき、g_n(x) が一様に 0 に収束することを
示せばよいことになります。
仮定から、g_n(x)\le g_{n-1}(x) より、g_n(x) は単調非増加で
0 に収束します。
この関数列が一様収束ではないとします。
このとき、ある正の実数 \epsilon_0 に対して、どんな自然数 n に対しても
m>n c_n\in [a,b] が存在して、g_m(c_n)>\epsilon_0 が存在します。
ここで、g_n(c_n)\ge g_m(c_n)>\epsilon_0 が成り立つことがわかります。
つまり、g_n(c_n)>\epsilon_0 が成り立ちます。
ここで、ボルツァーノ-ワイエルシュトラスの定理により、
c_n には [a,b] において収束する部分列が存在します。

そのような部分列は自然数の単調増加列 n_1<n_2<n_3<\cdots を用いて
c_{n_1},c_{n_2},\cdots, c_{n_j}\cdots であるとし、その極限を c\in[a,b] とすると、
g_n は連続であるから、g_n(c_{n_j})\to g_n(c) となります。
ここで、n_j\ge n なる任意のj に対して g_n(c_{n_j})\ge g_{n_j}(c_{n_j})\ge \epsilon_0
が成り立ちます。g_n の連続性から
g_n(c)\ge \epsilon_0>0 が成り立ち、これは、g_n(x)0
収束することに矛盾します。(特にg_n(c)0  に収束しない。)

ゆえに、g_n(x) は、一様に 0 に収束します。\Box

Diniの定理についての話は、
2015年度の微積分II演習のページ(リンク)
にも書いていますのでご参照ください。

補題
アルゼラの定理の中で出てきている等式をひとつ示しておきます。

補題
実数 \xi,\eta に対して、
\min\{\xi,\eta\}=\frac{1}{2}(\xi+\eta-|\xi-\eta|)である。

(証明)
もし\xi\ge \eta なら、
\frac{1}{2}(\xi+\eta-(\xi-\eta))=\eta となり
もし\xi\le \eta なら、
\frac{1}{2}(\xi+\eta-(-\xi+\eta))=\xi となり
この等式が成り立つ。\Box

同様に、
\max\{\xi,\eta\}=\frac{1}{2}(\xi+\eta+|\xi-\eta|) となります。

とくに、a(x)b(x) が連続関数であるとすると、
\min\{a(x),b(x)\}\min\{a(x),b(x)\} も連続関数である。\Box



一様収束しないが、一様有界で極限と積分の交換が成り立つ例をいくつか与えます。
(といっても挙げた例はアルゼラの定理を使わなくても交換が成り立つことがわかる
ものばかりでした。何か他に良い例があると思いますが、私は思いつきませんでした。)

例1
[0,1] 閉区間において、
f_n(x)=\begin{cases}2nx&0\le x\le \frac{1}{2n}\\-2nx+2&\frac{1}{2n}\le x\le\frac{1}{n}\\0&\frac{1}{n}\le x\le 1\end{cases}
として定義しますと、この関数列は、恒等的に 0 となる関数に
一様収束しませんが、各点収束します。
また、一様有界な関数列で、[0,1] で連続な関数に収束しますので、
積分と極限の順序交換が成り立ち、
\lim_{n\to\infty}\int_0^1f_n(x)dx=0
が成り立ちます。

例2
[0,1] による関数として
f_n(x)=x^n とします。
このとき、f_n(x) は一様収束しませんが、一様有界で
(0,1) で連続な関数に収束するので、
\lim_{n\to\infty}\int_0^1x^ndx=0
となります。

閉区間に不連続点が有限個あったととき、その関数の積分は
その点を除いて積分してやることで計算したものになります。

なので、例2の関数の各点収束先は、
f(x)=\begin{cases}0&1\le x<1\\1&x=1\end{cases}
ですが、この積分は、f(x)\equiv 0 の積分と等しくなります。

ただ、この例だと、具体的に積分が計算できてしまい、
\int_0^1x^ndx=\frac{1}{n+1} なので、上のアルゼラの定理を
使うまでもないということになります。
積分が計算できるという点では例1もそうですが。

例3
[0,\frac{\pi}{2}]において、
f_n(x)=\sin^nx とすると、
この場合も、一様収束せず、一様有界で、
[0,\frac{\pi}{2}) で0で、x=\frac{\pi}{2} のときに1
となる関数に各点収束します。

よって、この場合も
\lim_{n\to\infty}\int_0^{\frac{\pi}{2}}\sin^nxdx=0
となります。
この積分は、部分積分を繰り返すことで
\int_0^{\frac{\pi}{2}}\sin^nxdx=\begin{cases}\frac{(n-1)!!}{n!!}&n\text{奇数}\\\frac{(n-1)!!}{n!!}\frac{\pi}{2}&n\text{偶数}\end{cases}
と計算できます。
つまり、アルゼラの定理を使えば、偶奇のどちらにしても
\frac{(n-1)!!}{n!!}\to 0がわかるということになります。

2020年6月9日火曜日

数学リテラシー1(第10回)

[場所:manaba上(水曜日12:00〜)]



今回の授業では、置換を用いて 行列式を定義しました。


符号
まず符号 
\text{sgn}:S_n\to \{1,-1\}
の定義をします。 

置換 \sigmam 個の互換 \tau_1\cdots, \tau_m の積で
\sigma=\tau_1\cdots \tau_m
と書けたとするとき、

\text{sgn}(\sigma)=(-1)^m

と定義します。
この数 1 or -1 を置換 \sigma符号といいます。

この定義は、ある置換の互換の積が偶数である場合は、1
または、奇数である場合は -1 ということと同じです。

符号をきちんと定義するためには置換を互換の積で書いた時に、それが偶数個の
互換の積であるか、奇数個の互換の積であるかはその表示の仕方によらないことを
示す必要があります。


例えば1から3までの数を並べ替える方法は6個になります そのうちで 以下の置換
e, (1,2,3), (1,3,2) は、必ず偶数個の互換の積に書くことができます。

置換をあみだくじ、もしくは、上のような数字を結ぶ線を描いたものと
考えることもできます。つまり、線には、1から3までの数が割り当てられている
ことになります。

これらの置換の交わった点の個数が互換の個数ということになります。
たとえば、恒等置換の場合を考えます。
1の線分を描きます。その上に2の線を描いたときに、必ず、偶数個で交わります。
というのも、1,2は、上と下とで順番同じなので、必ず、1に交わったら、もう1回まじわらないと、この順番にたどり着くことができません。
また、3の線をかいたときも同じで、3の線が1の線と交わったら、もう一回
交わらないと、この順番でたどり着きません。
3の線が2の線と交わったときも同様です。
よって、このとき、交わった点の数は、必ず偶数個になります。
(1,2,3)(1,3,2) の場合の置換も同じことを表します。
(実は、このようにあみだを使って説明をしてもしても置換の全ての
互換の積がいつでも偶数ということの証明にはならないのですが.....
というのも、このように、あみだによって書かれる互換の積の分解は、
隣り合った数の互換の積によってかけているだけです。)


おなじように、次の3つの 置換は 奇数個の互換の積によってかけます。


行列式の定義

では、符号を使って行列式を定義しましょう。
(n,n) 行列 A=(a_{ij}) の行列式を以下のように定義します

\det(A)=\sum_{\sigma\in S_n}\text{sgn}(\sigma)a_{1\sigma(1)}a_{2\sigma(2)}\cdots a_{n\sigma(n)}

ここで、Σの記号の下に\sigma\in S_n が書かれているのは、
S_n の元に従って足し合わせるということです。
ですので、特に、n! 個の和であるということになります。

 例えば(2,2) 行列の場合に行列式の定義に従って計算します。

S_2=\{e,(1,2)\}ですから、
以下のようになります。
\det(A)=a_{11}a_{22}-a_{12}a_{21}
ということになります。
A=\begin{pmatrix}a&b\\c&d\end{pmatrix} の場合、\det(A)=ad-bc
と定義したわけですから確からこの定義と合っています。

次に、(3,3) 行列の行列式を計算をします。
A=\begin{pmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{pmatrix}
として、6個の和を書き下してみると、以下のようになります。
この項の順番は、上に登場した置換の順番に沿ってかきました。

\det(A)=a_{11}a_{22}a_{33}+a_{12}a_{23}a_{31}+a_{13}a_{21}a_{32}-a_{12}a_{21}a_{33}-a_{11}a_{23}a_{32}-a_{13}a_{22}a_{31}

この公式を覚えるのに役に立つのが、サラスの公式です。
(3,3) 行列に、下のような6本の線をかいてやります。
そのとき、その線にぶつかった成分をかけて符号をつけて足し上げることによって
行列式が計算できます。
ただし、黒いほうを正の符号とし、赤いほうを負の符号とするのです。


転置行列と行列式

転置行列の行列式は元の行列の行列式と同じになります。
\sigmaに対して、転置行列の行列式は、

\det(^tA)=\sum_{\sigma\in S_n}\text{sgn}(\sigma)a_{\sigma(1)1}\cdots a_{\sigma(n)n}
ですが、\sigmaに対して、\sigma^{-1} はその符号を変えず、
これは、積の順番を入れ替えれば、
=\sum_{\sigma\in S_n}\text{sng}(\sigma)a_{1\sigma^{-1}(1)}\cdots a_{n\sigma^{-1}(n)}
となりますが、\sigma\mapsto \sigma^{-1} は一対一ですから、
\sigma^{-1} を再び \sigma に置きなおすことで、
=\sum_{\sigma\in S_n}\text{sgn}(\sigma)a_{1\sigma(1)}a_{2\sigma(2)}\cdots a_{n\sigma(n)}
となるので、これは\det(A) となります。
よって、転置行列の行列式はもとの行列の行列式と同じになります。

行列式の交代性

2つの行を交換して得られる行列と、2つの列を交換して得られる行列の行列式は
ちょうど元の行列式の -1 倍になります。

例えば、i 列と j 列を入れ替えた行列をA' とする。i<j
であると仮定します。
\det(A')=\sum_{\sigma\in S_n}\text{sgn}(\sigma)a_{1\sigma(1)}\cdots a_{j\sigma(i)}\cdots a_{i\sigma(j)}\cdots a_{n\sigma(n)}
ここで、\tau=(i,j)とすると、
=\sum_{\sigma\in S_n}\text{sgn}(\sigma\tau)\text{sgn}(\tau)a_{1\sigma\tau(1)}\cdots a_{i\sigma\tau(i)}\cdots a_{j\sigma\tau(j)}\cdots a_{n\sigma\tau(n)}
=\sum_{\sigma\in S_n}\text{sng}(\tau)\text{sgn}(\sigma)a_{1\sigma(1)}\cdots a_{i\sigma(i)}\cdots a_{j\sigma(j)}\cdots a_{n\sigma(n)}
=-\sum_{\sigma\in S_n}\text{sng}(\sigma)a_{1\sigma(1)}\cdots a_{n\sigma(n)}=-\det(A)

2つの行を交換して得られる行列式が-1になることも、
上の転置をとることによって行列式が変わらないことから
従います。

この交代性から、
Aの第 i{\bf a}_i と第 j{\bf a}_j が、{\bf a}_i={\bf a}_j であるとするとき、その第 i 列と j を交換した行列を A' とすると、AA' は同じ行列であるから、
\det(A)=-\det(A) である。
よって、\det(A)=0 となります。



多重線形性
n 個の n 次元ユークリッド空間の元のペアから実数への写像
f:{\mathbb R}^n\times \cdots \times {\mathbb R}^n\to {\mathbb R}
が、任意のi 個目のベクトルに対して、
f({\bf v_1},\cdots,{\bf v}_i+{\bf v}_i',\cdots, {\bf v}_n)=f({\bf v}_1,\cdots, {\bf v}_i,\cdots, {\bf v}_n)+f({\bf v}_1,\cdots, {\bf v}_i',\cdots, {\bf v}_n)
かつ、実数 c に対して

f({\bf v}_1,\cdots, c{\bf v}_i,\cdots {\bf v}_n)=cf({\bf v}_1,\cdots, {\bf v}_i,\cdots, {\bf v}_n)
を満たすとき、f多重線形性を満たすといいます。

\det は多重線形写像であることを示します。
A'' の第 i 列が \begin{pmatrix}a_{1i}+a_{1i}'\\a_{2i}+a_{2i}\\\vdots \\a_{ni}+a_{ni}'\end{pmatrix}
であり、他の第 (k,j) 成分は、a_{kj} であるとします。
また、A=(a_{ij})とし、A' の第i列は、
\begin{pmatrix}a_{1i}'\\a_{2i}'\\\vdots \\a_{ni}'\end{pmatrix}
であるとします。
このとき、

\det(A'')=\sum_{\sigma\in S_n}\text{sgn}(\sigma)a_{1\sigma(1)}\cdots (a_{i\sigma(i)}+a_{i\sigma(i)}')\cdots a_{n\sigma(n)}
=\sum_{\sigma\in S_n}\text{sgn}(\sigma)a_{1\sigma(1)}\cdots a_{i\sigma(i)}\cdots a_{n\sigma(n)}
+\sum_{\sigma\in S_n}\text{sng}(\sigma)a_{1\sigma(1)}\cdots a_{i\sigma(i)}'\cdots a_{n\sigma(n)}
=\det(A)+\det(A')
となり、実数倍の方も同様にやることにより、\det の多重線形性が満たされました。

A({\bf x}) を第 i 列が {\bf x} となる行列であるとすると、
A の第 k 列を {\bf a}_k であるとする。
このとき、多重線形性を用いると、
\det(A({\bf a}_i+c{\bf a}_j))=\det(A({\bf a}_i))+\det(A(c{\bf a}_j))
=\det(A({\bf a}_i)+c\det(A({\bf a}_j))=\det(A({\bf a}_i))=\det(A)

まとめ

行列式を写像 \det:{\mathbb R}^n\times \cdots \times {\mathbb R}^n\to {\mathbb R}と思うと、交代的な多重線形性を持つ写像。
行列 A の第 j 列を他の第 i 列に定数倍をして足してやったものは、
元の行列式を変えない。

また、単位行列 E に対して、
\det(E)=1
であることも定義から従います。


2020年6月2日火曜日

数学リテラシー1(第9回)

[場所:manaba上(火曜日12:00〜)]


今回と次回で、行列式を定義します。
最終的に、次回において行列式を定義しますが、今回は
行列式を定義するために用いる置換について解説しました。
行列式は、(2,2) 行列のときに \begin{pmatrix}a&b\\c&d\end{pmatrix}
のときに ad-bc として定義していますが、
ここでは、一般の (n,n) 行列のときの行列式を定義します。

n 文字の集合の間の全単射の集合と置換
まず、
\Omegan 個の数字からなる集合 \{1,2,\cdots, n\} とし、
S_n=\{\sigma:\Omega\to \Omega|\sigma:\text{全単射}\}
とおきます。
つまり、\sigma\in S_n\Omega 上の写像で、全単射なものということです。

ここで全単射というのは、全射かつ単射な写像であったこと思い出してください。
つまり 写像で、逆写像が存在するようなもののことでした。

この集合はn 個の数字をちょうど入れ替えており、
つまりn 個の数字を並べ替える方法全体と一致しています。

この並び替え、つまり、置換が、S_n の元ということです。
つまり、S_n n 個の文字の並び替えの全体の集合といってもよいわけです。

よって S_n に含まれる要素は $n$ 個の数字の順列の数と同じということで、
S_n には、n! 個の元が
含まれることになります。
よって、S_n の元のことをこれから単に置換ということにします。

置換の書き方
置換は、(2,n) 行列を用いて、

\begin{pmatrix}1&2&\cdots&n\\\sigma(1)&\sigma(2)&\cdots&\sigma(n)\end{pmatrix}
として書き表すことが一般的です。
つまり、置換を写像として考えたとき、縦ベクトルとして、
i とその行先(像)の関係を書いたものということになります。
ですので、
この行列のある縦ベクトルを他の縦ベクトルと入れ替えてできる
(2,n) 行列が表す置換も同じ置換を表すことになります。

例えば、n=3 の場合であれば、S_3 の元は
\begin{pmatrix}1&2&3\\1&2&3\end{pmatrix},\begin{pmatrix}1&2&3\\2&1&3\end{pmatrix},\begin{pmatrix}1&2&3\\1&3&2\end{pmatrix}
\begin{pmatrix}1&2&3\\3&2&1\end{pmatrix},\begin{pmatrix}1&2&3\\2&3&1\end{pmatrix},\begin{pmatrix}1&2&3\\3&1&2\end{pmatrix}

の3!=6通りとなります。

また、n 個の数字を並び替える集合とは、次のように
n 個の数字をあみだくじによって入れ替えを行ったものと考えることもできます。
これは、上の S_3 の置換をあみだくじで書いたものです。

最も左上のあみだくじに対応するものを 恒等置換といいます。恒等置換というのは何も置き換えない置換のことをいいます。 写像でいえば、恒等写像に対応します。

ただし、置換に対して、あみだくじで書く方法はさまざまあります。
これは考えればすぐにわかることですが、たとえば、
のようなあみだを考えれば、このあみだが恒等置換を表すことがわかるでしょう。

置換の積
置換には、積を定義することができます。
あみだくじで言えばあみだくじを縦に並べたもの、
写像の言葉で言えば写像の合成のことです。
例えば、
\sigma=\begin{pmatrix}1&2&3\\2&1&3\end{pmatrix}

\tau=\begin{pmatrix}1&2&3\\3&2&1\end{pmatrix} の積を考えると、
\begin{pmatrix}1&2&3\\2&3&1\end{pmatrix}
のようになります。できた置換は、\tau\sigma
と書きます。
この順番は、写像の合成の意味が込められており、この順番に
なっています。

このことをあみだの言葉で言えば、
上に \tau、下に \sigma を並べてやることで、

のようになります。このように絵を使ってこの計算をすることができます。
なんとなく、\tau を下に置くのかと勘違いするかもしれませんが、
逆ですので注意してください。

逆置換
逆置換というのは写像の逆写像を取ったものつまり あみだくじの鏡像をとったものとして定義できます。

鏡像というのは水平な線を鏡として得られるようなあみだくじのことです。

例えば、
\begin{pmatrix}1&2&3\\3&1&2\end{pmatrix}

の場合ですと、この置換の上と下を入れ替えて、
\begin{pmatrix}3&1&2\\1&2&3\end{pmatrix}
となり、また、上の行を1,2,3の順にあるように、縦ベクトルを
入れ替えると、
\begin{pmatrix}1&2&3\\2&3&1\end{pmatrix}
のようになります。

置換の性質をここで おさらいしておきます。
  1. 2つの置換の積を取ることができる。
  2. 任意の置換に対して逆置換が必ず存在すること。
  3. 恒等置換が存在すること。
ということになります。 
実は、この性質は、数学における群論の初歩をやっていることに相当します。
群論というのは、大学では3年生くらいで習う、何かの変換全体の集合を
考える理論です。
置換全体は群の例の一つですが、

群論においては置換全体の集合は n 次対称群と呼ばれます。

数学全般はもちろんのこと、物理や化学でも群論の考えかたを応用した
理論は多いです。
ちなみに、群論を初めて応用したのは、エヴァリスト・ガロア(19世紀の数学者)
で、群論を用いて5次以上の方程式の解に、
その係数の四則演算べき乗根で解けないものが存在することを証明しました。

巡回置換と互換

次に置換 \sigma\in S_n
\{i_1,\cdots, i_r\}\subset \Omega に対して、
i_1\mapsto i_2,\ i_2\mapsto i_3\cdots, i_{r}\mapsto i_1
と写し、それ以外では数を変えないものを巡回置換といいます。

そのような巡回置換を (i_1,i_2,\cdots, i_r) のように書きます。
この巡回の長さ r を巡回置換の長さといいます。

特に長さが2の巡回置換のことを互換といいます。
任意の置換 \sigma\in S_n に対して、任意の i\in \Omega に対して、その行先を
順次たどっていけば、必ずもとの i に戻ってくる巡回置換をなしています。

よって、すべての置換は 互いに交わらない巡回置換の積に書くことができます。

また巡回置換は いくつかの互換を使って
(i_1,\cdots, i_r)=(i_1,i_{r})\cdots (i_1,i_3)(i_1,i_2)
のように書くことができます。
他の書き方として、
(i_1,\cdots, i_r)=(i_1,i_{2})(i_2,i_3)\cdots (i_{r-1},i_r)
もあります。

これらのことから、全ての置換はいくつかの互換の積によって書き表すことができる
ことになります。

これは、あみだくじを考えれば明らかで、任意の置換はあみだくじですから、

置換をあみだくじによって描いたとき、線を少々ずらすことで、交わりを全て二重点だけにしておくことができます。
各交差点において、数字が互換のようにして
入れ替わり、その合成によって全ての置換を互換の
積に書くことができるということになります。
(このとき、全ての線は上から下に、途中で止まらずに流れていくものとします。)



この横線の数が表示した互換の数に相当します。

例として教科書やスライドにあった次の置換を用いて考えます

\begin{pmatrix}1&2&3&4&5&6&7\\4&5&6&7&2&3&1\end{pmatrix}
個々の数字をたどっていくことで、
この置換は長さが3の巡回置換 (1,4,7) と長さが2の2つの巡回置換 (2,5)
(,6) の積に書かれることがわかるでしょう。

2020年5月28日木曜日

数学リテラシー1(第8回)

[場所:manaba上(土曜日12:00〜)]


第6回では、直交行列によって対角化できる行列は
対称行列であることを証明しましたが、
その逆が成り立つことを今回は示します。

つまり、

定理
実対称行列は固有値は実数であり、
さらに、ある直交行列によって対角化できる。

です。
今回も、(2,2) 行列しか扱いません。

まず、最初の主張は、\begin{pmatrix}a&b\\b&c\end{pmatrix}
の固有多項式を求めると、
t^2-(a+d)t+ad-b^2 となり、
この判別式を求めると、
D=(a+d)^2-4(ad-b^2)=(a-d)^2+4b^2 となり
この値は正の数または0です。
よって、固有多項式は、2つの実数を解に持つということになります。
(重解を含む。)
もし、重解をもつとすると、a=d かつ b=0 であるから、
そのような行列は、スカラー行列 aE ということになります。
ここで、a はある実数で、aE は行列 \begin{pmatrix}a&0\\0&a\end{pmatrix}
のことです。

実対称行列の実固有値は \lambda_1,\lambda_2 の2つ存在します。
ただし、\lambda_1=\lambda_2 の場合も存在します。
そのうちの一つの固有値を \lambda_1 とします。
その固有ベクトルは存在し、{\bf v}_1 とします。
ここで、{\bf v}_1 は長さが1であるとしておきます。

このとき、A{\bf v}_1=\lambda_1{\bf v}_1 となります。
また、{\bf v}_1 に直交するベクトルを {\bf v}_2 とします。
{\bf v}_2 も長さが1のベクトルであるとしておきます。

このとき、{\bf v}_1,{\bf v}_2 は、正規直交基底とよばれ、それを
並べてできる (2,2) 行列 R=({\bf v}_1{\bf v}_2)
直交行列になります。つまり、^tRR=E を満たします。

(ここで注意として、固有ベクトルを取るときには、
長さを1にしたり、直交ベクトルを取る必要はありません。
この話では、直交行列によって行列を対角化するために
このような操作をしています。)

このとき、

A{\bf v}_2=p{\bf v}_1+q{\bf v}_2 のように、{\bf v}_1{\bf v}_2
一次結合で表されます。ここで、p,q は、何か実数です。

そうすると、A({\bf v}_1{\bf v}_2)=({\bf v}_1{\bf v}_2)\begin{pmatrix}\lambda_1&p\\0&q\end{pmatrix}
のようにあらわされます。

よって、


このとき、R=({\bf v}_1{\bf v}_2) とすると、
AR=R\begin{pmatrix}\lambda_1&p\\0&q\end{pmatrix}=RS

とします。
このとき、A=RSR^{-1} となり、
A が対称行列であることから、全体に転置行列を取ることによって、
A={}^tA={}^t(RSR^{-1})=R{}^tSR^{-1}
となり、AR=R{}^tS=RS
ですから、R を左からかけて、S={}^tS となります。
つまり、S は対称行列にならなければならないから、p=0 ということです。
つまり、A{\bf v}_2=q{\bf v}_2 であることから、
{\bf v}_2 は固有ベクトルであり、q=\lambda_1 であるなら
{\bf v}_2\lambda_1 の固有ベクトルであり、
q\neq \lambda_2 であるなら、{\bf v}_2 は相異なる固有値を
もち、{\bf v}_2 はその固有ベクトルということになります。

ゆえに、実対称行列 A は、直交行列 R を用いて、
R^{-1}AR を対角行列にすることができます。

例1
A=\begin{pmatrix}1&-3\\-3&1\end{pmatrix} とすると、
A は実対称行列であることから、直交行列によって対角化されます。

固有値を計算すると、-2,4 であり、
それぞれのこゆうベクトルを求めます。
-2E-A=\begin{pmatrix}-3&3\\3&-3\end{pmatrix}
ですから、連立一次方程式 (-2E-A){\bf x}={\bf 0} の解として、
\begin{pmatrix}1\\1\end{pmatrix}
を選べます。
また、
4E-A=\begin{pmatrix}3&3\\3&3\end{pmatrix}
ですから、連立一次方程式 (4E-A){\bf x}={\bf 0} の解として
\begin{pmatrix}1\\-1\end{pmatrix}
を選べます。
このとき、\tilde{{\bf v}}_1=\begin{pmatrix}1\\1\end{pmatrix} とし、
\tilde{\bf v}_2=\begin{pmatrix}1\\-1\end{pmatrix} とすると、
それらは直交していますね。
さらにそれから直交行列を作る場合、長さでわって
{\bf v}_1=\frac{1}{\sqrt{2}}\begin{pmatrix}1\\1\end{pmatrix}
{\bf v}_2=\frac{1}{\sqrt{2}}\begin{pmatrix}1\\-1\end{pmatrix}
とすることで、直交行列 P=({\bf v}_1{\bf v}_2) を得る。


例2
ここで、簡単な例で、実対称行列で対角化可能だが、
直交行列でなくても対角化できることを見てみます。
A として単位行列 E を考えれば、
任意の逆行列をもつ行列 P に対して、P^{-1}AP=E ですから
対角化ができています。一般に、逆行列をもつ P といっても
直交行列とは限りません。

次の例をみましょう。

例3

\begin{pmatrix}3&-1\\2&0\end{pmatrix}
この行列は、実対称行列ではないので、直交行列によって対角化はできませんが、
対角化は可能です。
この固有値は、1,2 であり、それぞれの固有ベクトルは、
E-A=\begin{pmatrix}-2&1\\-2&1\end{pmatrix} ですから、
連立方程式
(E-A){\bf v}={\bf 0} の解として、
{\bf v}_1=\begin{pmatrix}1\\2\end{pmatrix}が選べます。

また、
2E-A=\begin{pmatrix}-1&1\\-2&2\end{pmatrix} ですから、
連立一次方程式 (2E-A){\bf x}={\bf 0} の解として、
{\bf v}_2=\begin{pmatrix}1\\1\end{pmatrix} をとることができる。

たしかに{\bf v}_1{\bf v}_2 は直交しません。
この行列 A は、 P=\begin{pmatrix}1&1\\2&1\end{pmatrix} によって
対角化することはできます。

例4
次に、連立漸化式から数列の一般項を出す方法を考えます。

x_1=3,y_1=1
\begin{cases}x_{n+1}=4x_n+10y_n\\y_{n+1}=-3x_n-7y_n\end{cases}
このとき、この漸化式を以下のように行列を用いて考えることができます。
\begin{pmatrix}x_{n+1}\\y_{n+1}\end{pmatrix}=\begin{pmatrix}4&10\\-3&-7\end{pmatrix}\begin{pmatrix}x_n\\y_y\end{pmatrix}
ここにでてきた (2,2) 行列を A=\begin{pmatrix}4&10\\-3&-7\end{pmatrix}
とすると、この式を \begin{pmatrix}x_{n+1}\\y_{n+1}\end{pmatrix}=A\begin{pmatrix}x_n\\y_n\end{pmatrix} とすることができて、この式を繰り返し使うことで、
\begin{pmatrix}x_n\\y_n\end{pmatrix}=A^{n-1}\begin{pmatrix}x_1\\y_1\end{pmatrix}
をえることができます。

ここで、A^n の求め方は、前回やりましたから、ここで応用できますね。
実際、この行列の固有値は、-1,-2 ですから、
固有ベクトルを求めると、
-E-A=\begin{pmatrix}-5&-10\\3&6\end{pmatrix}
となりますから、この固有ベクトルは、\begin{pmatrix}2\\-1\end{pmatrix}
であり、
-2E-A=\begin{pmatrix}-6&-10\\3&5\end{pmatrix}
となりますから、この固有ベクトルは、\begin{pmatrix}5\\-3\end{pmatrix}
となります。
よって、P=\begin{pmatrix}2&5\\-1&-3\end{pmatrix} とすると、
P^{-1}AP=\begin{pmatrix}-1&0\\0&-2\end{pmatrix} となり、
A^n=P\begin{pmatrix}(-1)^n&0\\0&(-2)^n\end{pmatrix}P^{-1}=\begin{pmatrix}6(-1)^n-5(-2)^n&10(-1)^n+5(-2)^{n+1}\\3(-1)^{n+1}+3(-2)^n&5(-1)^{n+1}-3(-2)^{n+1}\end{pmatrix}
となります。
よって、
\begin{pmatrix}x_n\\y_n\end{pmatrix}=\begin{pmatrix}6(-1)^{n-1}-5(-2)^{n-1}&10(-1)^{n-1}+5(-2)^{n}\\3(-1)^{n}+3(-2)^{n-1}&5(-1)^{n}-3(-2)^{n}\end{pmatrix}\begin{pmatrix}3\\1\end{pmatrix}
=\begin{pmatrix}28(-1)^{n-1}-25(-2)^{n-1}\\14(-1)^n+15(-2)^{n-1}\end{pmatrix}
のように求めることができます。


まとめと対角化可能性について
実対称行列であることは、
行列が対角化可能であるための十分条件を
与えます。(さらに、直交行列によっても対角化できますが...)
他に、対角化可能であるためのわかりやすい条件として、
固有値が n 個ある(今の場合、2個ある場合です。

つまり、(2,2) 行列の固有値がちょうど2個ある場合、対角化可能です。
どうしてかというと、固有値に対して必ず、固有ベクトルが存在するので、
この場合、2個の固有ベクトルが存在します。
もちろんそれらは平行ではありません。もし平行なら、同じ固有値を持つはずです。

よって、固有ベクトルで作られる行列 P は逆行列をもち、
P^{-1}AP は対角行列になるからです。

よって、(2,2) 行列で対角化されるかどうかわからないのは、固有多項式が重解をもつ場合、つまり、固有多項式が (t-\lambda)^2 の形にかける場合ということになります。

もちろん固有多項式が重解だからといって、行列が対角化可能である場合も存在します。
極端な例として単位行列 E を考えてみてください。
この行列の行列式は、(t-1)^2 です。
ですから、固有多項式だけみて、最終的に対角化可能であるかどかわかるのは、
それが重解をもたない場合のみです。

しかし、(2,2) 行列で、固有多項式が重解をもち、対角化可能である場合は、
その行列がスカラー行列である場合に限られます。
ですので、
この場合、対角化可能ではない場合というのは、固有多項式が重解をもち、
スカラー行列ではない場合ということになります。
例えば、
\begin{pmatrix}1&1\\0&1\end{pmatrix} は対角化可能ではありません。
3次以上の正方行列の場合はもう少し複雑です。

2020年5月27日水曜日

数学リテラシー1(第7回)

[場所:manaba上(水曜日12:00〜)]


今回は固有値、固有ベクトル、行列の対角化、行列の n 乗についての内容でした。

固有値・固有ベクトル

固有値と固有ベクトルについてまとめておきます。

固有値と固有ベクトルというのは次のように定義されます。

{\bf v}固有ベクトルであるというのは、行列 A を左からかけたもの A{\bf v}
{\bf v} の定数倍になっているような
ゼロではないベクトルのことを言います。

つまり、ある数 \lambda を使って、
A{\bf v}=\lambda{\bf v} をみたす(ゼロではない)ベクトルのことです。
ここで、\lambda はある複素数になります。
行列 A が実数であっても、固有値が複素数になることはあります。

この \lambda のことを A固有値といいます。

また固有ベクトルはかならず零ベクトルではないということに注意をしてください。

もし零ベクトル を許すと、任意の複素数も固有値になってしまいます。
A{\bf 0}=\lambda{\bf 0} の関係式は任意の複素数\lambda が満たすからです。

このとき行列Aに対して固有ベクトルは以下の方程式を満たすことわかります。
A{\bf v}=\lambda{\bf v}\Leftrightarrow (\lambda E-A){\bf v}={\bf 0}

つまり \lambda E-A という行列は 逆行列を持たないということになります。

なぜならば もし逆行列を持てば、(\lambda E-A){\bf v}={\bf 0} という関係式に
\lambda E-A の逆行列を左からかけることで {\bf v}={\bf 0}という式が出てしまい、
{\bf v}\neq {\bf 0} であることに矛盾するからです。

よってわかったことは、\lambda E-A  という行列が逆行列をもたないこと、
同値なことに、

\lambda E-A の行列式が零であるということ です。

つまり、行列 Aの固有値\lambda は、\det(t E-A)=0 を満たす解ということになります。

この式 \det(t E-A)=0 は多項式です。この多項式のことを固有多項式といいます。
A が n 次正方行列であるなら、\det(t E-A) は、n 次固有多項式です。

A=\begin{pmatrix}a&b\\c&d\end{pmatrix}
のときに、固有多項式を求めてみると、
\det(tE-A)=\det\begin{pmatrix}t-a&-b\\-c&t-d\end{pmatrix}
=(t-a)(t-d)-bc=t^2-(a+d)t+ad-bc
=t^2-\text{tr}(A)t+\det(A)
となります。

この多項式の根を、\lambda_1,\lambda_2 とします。
a,b,c,d が実数、つまり A が実行列であるとすると、
  • 2つの異なる実数解の場合、
  • 2つの異なる複素解の場合、
  • 重解
の3パターンあります。

では次の行列
A=\begin{pmatrix}0&-1\\2&3\end{pmatrix}
の固有ベクトルを考えましょう

まずこの行列の固有値を求めましょう。
最初に固有ベクトルを求めようとしてはいけません。 

そのために固有多項式を求めます。
\text{tr}(A)=3, \text{det}(A)=2
ですから、t^2-3t+2 です。

固有値は 固有多項式の根のですから この二次方程式を解いて、
固有値は全部で、1,2 の2つあります。

まず、
固有値が 1 の場合の 固有ベクトル求めましょう。
このとき、tE-A=E-A\begin{pmatrix}1&1\\-2&-2\end{pmatrix} 

固有ベクトルは 次のような 連立方程式の解です。
\begin{pmatrix}1&1\\-2&-2\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix}={\bf 0}
この連立方程式は、x+y=0と同じですから、この方程式を

として、c を任意の実数として、
\begin{pmatrix}x\\y\end{pmatrix}=c\begin{pmatrix}1\\-1\end{pmatrix}
とします。 ここで、固有ベクトルは
{\bf v}_1=\begin{pmatrix}1\\-1\end{pmatrix}
なります 。

ここで、固有ベクトルは ゼロでないベクトルであれば何でもいいです。

というのも、ある固有値 に対する固有ベクトルというのは定数倍をしても

その固有値の固有ベクトルですから、本来その方向しか決まりません。
ですので、固有ベクトルを与えるときは 連立方程式 を満たす。
適当なゼロではないベクトルを選ぶことになります

同様に固有値が 2 の場合の 固有ベクトル求めましょう。 
そのとき、固有ベクトルが満たす連立方程式は
(2E-A)\begin{pmatrix}x\\y\end{pmatrix}=\begin{pmatrix}2&1\\-2&-1\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix}={\bf 0}
であるから、
ゼロではないベクトル求めると

{\bf v}_2=\begin{pmatrix}-1\\2\end{pmatrix}
となります。この場合も、連立方程式を満たすゼロではないベクトルを選びました。


行列の対角化
ここでは、行列の対角化について考えます。

行列の対角化というのは 行列 A に対して 行列 P とその逆行列 P^{-1}
を挟むことによって行列を対角行列にするということです。
つまり、P^{-1}AP を対角行列にするのです。

ここで先ほどの例を考えます。行列 P として
固有ベクトルを並べたものを考えましょう。
つまり、P=({\bf v}_1{\bf v}_2)=\begin{pmatrix}1&-1\\-1&2\end{pmatrix} です。

このとき、AP=A({\bf v}_1{\bf v}_2)=(A{\bf v}_1A{\bf v}_2)
となります。
最後の行列は、AP=({\bf v}_12{\bf v}_2)=\begin{pmatrix}1&0\\0&2\end{pmatrix}({\bf v}_1{\bf v}_2)=\begin{pmatrix}1&0\\0&2\end{pmatrix}P
となります。
よって、P の逆行列 P^{-1} を左からかけることで、
P^{-1}AP=\begin{pmatrix}2&0\\0&1\end{pmatrix}
となるので、このとき、AP によって対角行列にすることができたことになります。
つまり、P=\begin{pmatrix}1&-1\\-1&2\end{pmatrix} とするとき、
P^{-1}AP=\begin{pmatrix}1&0\\0&2\end{pmatrix} となります。
固有ベクトルの順番を入れ替えて、Q=\begin{pmatrix}-1&1\\2&-1\end{pmatrix}
としてやると、
Q^{-1}AQ=\begin{pmatrix}2&0\\0&1\end{pmatrix} が得られます。
また、固有ベクトルを定数倍してやってやっても、対角化する行列(Pのこと)
は違うものになるかもしれませんが、最終的な対角行列は同じものになります。
ここで、対角化したときの対角行列は、固有値を対角成分に並べた行列になります。

この計算は、この時だけうまくいったわけではなく、一般の行列 A に対しても
固有ベクトルを並べてできる行列 P とその逆行列 P^{-1} を持ってくると
対角成分に固有値を並べた対角行列を求めることがわかります。

ただし、対角化できるためには条件があって、
固有ベクトルを並べて正方行列を作らなければならないということです。
つまり、固有ベクトルが n 個、この場合は、2個存在しないといけません。

しかし、固有ベクトルは、定数倍をしても固有ベクトルですから、
正確に言えば、固有ベクトルとして、一次独立な n 個のベクトルを取る必要があります。
そして、一次独立な固有ベクトルが n 個(今は2個)とることができれば、
AP=PD となります。ここで、D は対角行列です。

今、P 一次独立な n 個のベクトル(今は2個のベクトル)から成っていたので、
行列式がゼロではない、つまり、P は逆行列を持つことになります。
よって、行列 A
P^{-1}AP=D のように対角化することができます。

行列のn

行列の対角化を利用して 行列の $n$ 乗を計算しましょう。

正方行列 A に対して、その n 乗を求めてみます。
A^nAn 回かけて得られる行列ですが、対角化を求めることができます。

A は行列 P=\begin{pmatrix}1&-1\\-1&2\end{pmatrix} とおくことで、
P^{-1}AP=\begin{pmatrix}1&0\\0&2\end{pmatrix} となります。
ここで、A^n をする代わりに、この行列の n 乗を考えます。

そうすると、P^{-1}APn 乗は、
(P^{-1}AP)^n=P^{-1}APP^{-1}AP\cdots P^{-1}AP=P^{-1}A^nP となり、
A^n が出現しました。
一方、対角行列の n乗は、\begin{pmatrix}1^n&0\\0&2^n\end{pmatrix}=\begin{pmatrix}1&0\\0&2^n\end{pmatrix}
となりますから、再び対角行列です。

よって、P^{-1}A^nP=\begin{pmatrix}1&0\\0&2^n\end{pmatrix}
となります、これはちょうど、A^nの対角化をしていることになります。

この式から、両側から PP^{-1} で挟むことで、
A^n=P\begin{pmatrix}1&0\\0&2^n\end{pmatrix}P^{-1}
=\begin{pmatrix}1&-1\\-1&2\end{pmatrix}\begin{pmatrix}1&0\\0&2^n\end{pmatrix}\begin{pmatrix}2&1\\1&1\end{pmatrix}
=\begin{pmatrix}2-2^n&1-2^n\\-2+2^{n+1}&-1+2^n\end{pmatrix}

となります。これが、A^n の一般公式ということになります。

このように行列の n 乗を求めるのに、
まず、行列を対角化 P^{-1}AP=D をしておきます。
この対角行列 D には、その対角成分に固有値が並びます。
この行列の n 乗を求めることで、
P^{-1}A^nP=D^n
を得ることができます。D^n は再び対角行列になっています。

(このことから、すぐわかることは、A が対角化できるのなら、A^n も対角化を
することができます。対角化をいつすることができるのかについては、上の
行列の対角化の部分の最後を見てください。)

この式に PP^{-1} を両側からかけることによって、
A^n=PD^nP^{-1} を計算することができます。
この式行列 An 乗の公式ということになります。

このように、固有値は、行列の n 乗を計算するのに大変役に立っている
ということになります。

2020年5月25日月曜日

数学リテラシー1(第6回)

[場所:manaba上(火曜日12:00〜)]


まずは正射影が表す線形変換について考えます。

正射影とその表す行列
まず次の問題を解いてみましょう。

問題
平面上の正射影の表す線形写像を行列 A をもって表示せよ。


まず、平面上の正射影というのは次のような写像
f:{\mathbb R}^2\to {\mathbb R}^2 のことです

まず平面上の直線 L を用意します 。

平面上に点 {\bf x} を取ります。この点 {\bf x} から 直線 L への垂線を考え,
その垂線と L の交わったところ (つまり垂線の足)を f({\bf x}) とするのです。

正射影というのは、ある直線へのベクトルの影を求める操作ということになります。
この場合、直線 L は原点を通る場合のみであることに注意しましょう。
(一般に正射影といった場合、原点を通るとは限りません。)

今、2通りのやり方で行列 A を求めてみます。


(1つ目のやり方)

1つ目の設定は正射影が何らかの方法で線形写像であることが分かったします。

その仮定の下で解いてみます


まず直線 Ly=ax として与えておきます。 
線形写像というのは行列の左から積で表されていたことは前回やりました。

また、行列 A は標準基底(基本ベクトル)と像となるベクトルを並べた行列でした。

平面上の標準基底というのは、
{\bf e}_1=\begin{pmatrix}1\\0\end{pmatrix}, {\bf e}_2=\begin{pmatrix}0\\1\end{pmatrix}
でした。
つまり、f({\bf e}_i)={\bf a}_i (i=1,2) としたとき、
({\bf a}_1{\bf a}_2) が求める行列 A ということになります。

あとは、f({\bf e}_1)f({\bf e}_2) を求めればよいのですが、
それをここでは三角比を用いて求めてみます。 

ここで、y=ax の傾きは正の数であるとします。
f({\bf e}_1) の像は、ベクトル \vec{OA} なのですが、

その x 座標は、OH ですが 、長さ OA は、a=\tan\theta としたときの、

\cos\theta に対応するから、\cos \tan で表す式

\cos\theta=\frac{1}{\sqrt{1+\tan^2\theta}} を用いて、OA=\frac{1}{\sqrt{1+a^2}} となります。

また \sin の方を求めておけば、

\sin\theta=\tan\theta\cos\theta=\frac{a}{\sqrt{1+a^2}} となります。
ここで、平方根はプラスの方向を取っている。つまり、
\cos のうち、正の方を取っていますが、それは、
a>0 であることを暗に仮定しているからで、 a<0 であるときは、
\cos\theta=-\frac{1}{\sqrt{1+\tan^2\theta}} となります。


話を元に戻します。
これにより、OH=OA\cos\theta=\frac{1}{1+a^2} となります。
また、f({\bf e}_1)y 座標は、AH ですから、
AH=OA\sin\theta=\frac{a}{1+a^2} となり、
f({\bf e}_1)=\begin{pmatrix}\frac{1}{1+a^2}\\\frac{a}{1+a^2}\end{pmatrix}
となります。

同様に、f({\bf e}_2) を求めてみると、
まず、f({\bf e}_2)x 座標は、ちょうど AH ですから、\frac{a}{1+a^2} 
と一致します。
y 座標は、OB-OH ですから、1-\frac{1}{1+a^2}=\frac{a^2}{1+a^2} 
となります。

ゆえに、f({\bf e}_2)=\begin{pmatrix}\frac{a}{1+a^2}\\\frac{a^2}{1+a^2}\end{pmatrix}
となります。 

この2つのベクトル f({\bf e}_1)f({\bf e}_2) を並べることで得られる行列
\begin{pmatrix}\frac{1}{1+a^2}&\frac{a}{1+a^2}\\\frac{a}{1+a^2}&\frac{a^2}{1+a^2}\end{pmatrix}
は求める行列ということになります。
a=\tan\theta を用いると、この行列は、
\begin{pmatrix}\cos^2\theta&\cos\theta\sin\theta\\\cos\theta\sin\theta&\sin^2\theta\end{pmatrix}
となります。

(2つ目)

正射影が線形変換であるということを 用いないで  A を計算してみます。  
しかし この計算途中で正射影は線形変換であるということがわかります

正射影というのを3つ基本的な写像の合成だと考えます。
3つの写像は順番に、 -\theta 回転、 x 軸への射影、\theta 回転です。
この写像の合成は正射影を実現しています。



この分解は 前回の鏡映を3つの行列の積で変えたことに少し似ていますね。
回転はわかりますが、 x 軸への正射影は、

f(\begin{pmatrix}x\\y\end{pmatrix})=\begin{pmatrix}x\\0\end{pmatrix}
で、線形変換を行列を用いて
 f(\begin{pmatrix}x\\y\end{pmatrix})=\begin{pmatrix}1&0\\0&0\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix} とあらわすことができるので、
x 軸への正射影は線形変換であることがわかります。

よって、この3つはそれぞれ線形変換ですから その合成も線形変換になります。

これにより正射影変換は線形変換であるということがわかりました 


この行列の積を求めると以下のようになります。
\begin{pmatrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{pmatrix}\begin{pmatrix}1&0\\0&0\end{pmatrix} \begin{pmatrix}\cos\theta&\sin\theta\\-\sin\theta&\cos\theta\end{pmatrix}
=\begin{pmatrix}\cos^2\theta&\cos\theta\sin\theta\\\cos\theta\sin\theta&\sin^2\theta\end{pmatrix}
となり、確かに上の計算と合いました。



直交行列によって対角化できる行列
これまで ある線形変換 A をある直交行列 R を用いて 

RAR^{-1}
のように 得られる線形変換について考えていました。
A に当たる行列は、簡単な行列、例えば、\begin{pmatrix}1&0\\0&-1\end{pmatrix}
や、\begin{pmatrix}1&0\\0&0\end{pmatrix} など、対角行列(対角成分以外はすべて 0 )
のような行列を考えていました。

一般に、対角行列 A は、\begin{pmatrix}\lambda_1&0\\0&\lambda_2\end{pmatrix}
とすることができますが、
このような A  に対して、RAR^{-1} はどのような性質を持つのでしょうか?


RAR^{-1} の転置行列を取ってみます。
ここで、^t(XY)=^tY^tX となることに注意しましょう。
そうすると、^t(RR^{-1})=^t(R^{-1})^tR=E ですから、
^t(R^{-1})=(^tR)^{-1} となります。
つまり、逆行列を取る操作と転置行列を取る操作はどちらをさきに行っても同じということです。
そういうわけで、(^tR)^{-1}^t(R^{-1}) も区別はなく、^tR^{-1} と書いても
差支えないということになります。

また、R が直交行列であるとすれば、R^{-1}=^tR ですから、
^tR^{-1}=R ということにもなります。
そうすると、

^t(RAR^{-1})=^t(RA^tR)=R^t(RA)=R^tA^tR=RAR^{-1}
となります。途中、行列 A が対角行列であるから、^tA=A であることを用いました。

このことからわかることは、X=RAR^{-1} という行列は、
^tX=X であることです。

このように、転置行列を施すと、もとの行列に戻る行列を対称行列といいます。

たしかに、さっき求めた行列は、(1,2) 成分と (2,1) 成分は一致していましたね。
先週の鏡映変換も、(1,2) 成分と (2,1) 成分はどちらも \sin2\theta でした。

まとめると、対角行列 A に対して、直交行列 R を用いて
RAR^{-1} を求めると、対称行列になるということがわかりました。

実は、この逆も成り立ちます。

定理
任意の対称行列は、ある直交行列 R と対角行列 A を用いて、
RAR^{-1} と書き表される。

この定理は次回以降どこかで現れます。


行列式は符号付面積であること

これは行列式っていうのは、ある意味、符号付面積であると 言うことを考えたいと思います。

ここで符号付面積というのは平面上の2つのベクトル {\bf a}_1{\bf a}_2
によって作られるようなで平行四辺形の符号付面積という意味です

この2つが一致するということをここで見て行きます

A2\times 2 行列であるとし、その行列を縦ベクトルとして
A=({\bf a}_1{\bf a}_2) としてあらわされるとします。
このとき、
{\bf a}_1=\begin{pmatrix}r_1\cos\theta_1\\r_1\sin\theta_1\end{pmatrix}
{\bf a}_2=\begin{pmatrix}r_2\cos\theta_2\\r_2\sin\theta_2\end{pmatrix}
のようにあらわしたとします。ここで、平面上の極座標表示を用いました。
ここで、{\bf a}_1{\bf a}_2 のうちどちらかが0ベクトルであるとすると、
行列式はゼロなり、そのとき、符号付面積は0になりますので
この2つは一致しているということになります。

では、どちらもゼロベクトルではないときを考えます。そのとき、
\det({\bf a}_1{\bf a}_2)=r_1r_2(\cos\theta_1\sin\theta_2-\cos\theta_2\sin\theta_1)=r_1r_2\sin(\theta_2-\theta_1)
となります。

ここで、r_2|\sin(\theta_2-\theta_1)| は、{\bf a}_2 {\bf a}_1 に垂線を
おろしたときにできる平行四辺形の高さになります。
つまり、このとき、\det(A) は、{\bf a}_1 を底辺とする高さ r_2|\sin(\theta_2-\theta_1)|
となる、{\bf a}_1{\bf a}_2 によって作られる平行四辺形の面積ということになります。

また、符号付面積というのはどういうことかというと、\sin(\theta_2-\theta_1)
が負の数になることも考慮する必要があるということに対応します。
つまり、0<\theta_2-\theta_1<\piのときは、その値は正の数になりますが、
\pi<\theta_2-\theta_1<2\pi となると、負の数になります。
つまり、ベクトル {\bf a}_1{\bf a}_2 がこの順番に角度が180度より小さく
なるのなら、面積は正の数であり、{\bf a}_2{\bf a}_1 の順に角度が180度
より小さくなる時、面積は負の数になります。
ということは、行列式が0になるのは、2つのベクトルが0度をなすとき、もしくは
180度をなすときということになります。
つまり、それは、いいかえれば、2つのベクトルが
ちょうど平行になっているときです。


行列式がゼロでないとき
上で行列式がゼロでないとき、
2つのベクトルは平行ではないということを意味していました。

ここで、ベクトル {\bf a}_1{\bf a}_2 一次独立であるということを
実数 c_1,c_2c_1{\bf a}_1+c_2{\bf a}_2={\bf 0} を満たすとき、c_1=c_2=0 である
と定義します。
一次独立でないことを一次従属といいます。

ベクトル {\bf a}_1{\bf a}_2 が一次独立であることと、
それらのベクトルが平行であることは同値です。

もし、{\bf a}_1{\bf a}_2 が平行とすると、{\bf a}_1=k{\bf a}_2
もしくは、{\bf a}_2=k{\bf a}_1 を満たす実数k が存在することと同値です。
また、ベクトル{\bf a}_1{\bf a}_2 が一次従属であるとすると、
c_1{\bf a}_1+c_2{\bf a}_2={\bf 0} となる (c_1,c_2)\neq (0,0)
存在することと同値ですが、c_1\neq 0 であるとすると、 c_1 で割ることで、
{\bf a}_1=k{\bf a}_2 の形になります。
同じように、 c_2\neq 0 であるときは、{\bf a}_2=k{\bf a}_1 が成り立ちます。

よって、ベクトル {\bf a}_1{\bf a}_2 が一次従属であるということは、
それらが、平行であるということと同値となります。
言いかえれば、ベクトルと一次が独立であることと、
2つのベクトル{\bf a}_1{\bf a}_2
が平行ではないことが同値であることがわかります。
まとめますと、以下のようになります。
\det(A)\neq 0 であることは、2つのベクトル{\bf a}_1{\bf a}_2
平行ではないとき、つまり、{\bf a}_1{\bf a}_2 が一次独立であるときを意味します。
また、第4回でもやったように、行列式 \det(A) が0ではないということは、
行列A に逆行列が存在することと同値になります。
よって、以下が同値であるということになります。
  • 行列 A が逆行列をもつ
  • \det(A)\neq 0 である。
  • A=({\bf a}_1{\bf a}_2) としたとき、{\bf a}_1{\bf a}_2 は一次独立である。
  • {\bf a}_1{\bf a}_2 は平行ではない。
また、この否定をとると、
  • 行列 A が逆行列を持たない
  • \det(A)=0 である。
  • A=({\bf a}_1{\bf a}_2) としたとき、{\bf a}_1{\bf a}_2 は一次従属である。
  • {\bf a}_1{\bf a}_2 は平行である。

ということになります。

2020年5月19日火曜日

数学リテラシー1(第5回)

[場所:manaba上(水曜日12:00〜)]

数学リテラシー1のHP

前回は行列の一般論を行いました。

今回からを用いて、一次変換(線形変換)の扱い方を学びます。
(2,2) 行列に一次変換の本質が詰まっています。

ですので、(2,2) 行列をプロトタイプとし、その後一般のサイズの一次変換に出あった
ときにも同じように扱えるようにしたいと思います。

前回で重要だったことは、
線形写像 f:{\mathbb R}^n\to {\mathbb R}^m
(任意のベクトル{\bf x},{\bf y} と任意の実数 \lambda に対して、
f({\bf x}+{\bf y})=f({\bf x})+f({\bf y}) かつ f(\lambda {\bf x})=\lambda f({\bf x}) が成り立つ写像のこと)

は、必ずある行列 (m,n) 行列を用いて、
f({\bf x})=A{\bf x} としてあらわされるということでした。


(2,2) 行列による一次変換
線形写像が f:{\mathbb R}^2\to {\mathbb R}^2 の場合には、ある (2,2) 行列を用いて
f({\bf x})=A\cdot {\bf x} としてあらわされることになります。
この行列 A はどのようにして計算できるか考えてみましょう。

ベクトル {\bf x}=\begin{pmatrix}x_1\\x_2\end{pmatrix} は、
{\bf e}_1=\begin{pmatrix}1\\0\end{pmatrix},
{\bf e}_2=\begin{pmatrix}0\\1\end{pmatrix}
を用いて、

{\bf x}=x_1{\bf e}_1+x_2{\bf e}_2
のように書くことができます。
このとき、f の線形性から、

f({\bf x})=f(x_1{\bf e}_1+x_2{\bf e}_2)=x_1f({\bf e}_1)+x_2f({\bf e}_2)
のようになり、f({\bf e}_1)={\bf a}_1 かつ f({\bf e}_2)={\bf a}_2
のように置きます。ここで、{\bf a}_1{\bf a}_2
2次元のユークリッド空間のベクトルです。

そうすると、f({\bf x}) は、x_1{\bf a}_1+x_2{\bf a}_2=({\bf a}_1{\bf a}_2)\begin{pmatrix}x_1\\x_2\end{pmatrix}

となり、A=({\bf a}_1{\bf a}_2) とすれば、
f({\bf x})=A{\bf x}
ということになります。つまり、線形写像 f に対して求めようと思っていた
左からかける行列 A は、({\bf a}_1{\bf a}_2) と計算できることになります。

この行列 A は、2つの縦ベクトル {\bf a}_1{\bf a}_2 を並べてできる
(2,2) 行列です。

もともと、{\bf a}_1{\bf a}_2 が何だったかというと、
{\bf e}_1{\bf e}_2f による行先でした。

A を求めたければ、この2つの単位ベクトル
{\bf e}_1{\bf e}_2 の像を並べてできる行列を求めればよいことになります。
ベクトル  {\bf e}_1, {\bf e}_2 のことを、2次元の標準ベクトル(基底)といいます。

x 方向と y 方向への変倍の定数倍、回転、鏡映
例3.2.1
平面上、 x 方向に \lambda_1 倍し、
y 方向に \lambda_2 倍するような線形写像は、
\begin{pmatrix}1\\0\end{pmatrix}\mapsto\begin{pmatrix}\lambda_1\\0\end{pmatrix},\begin{pmatrix}0\\1\end{pmatrix}\mapsto \begin{pmatrix}0\\\lambda_2\end{pmatrix}
ですから、
{\bf e}_1\mapsto \lambda_1{\bf e}_1 であり、
{\bf e}_2\mapsto \lambda_2{\bf e}_2
ということですから、A=({\bf a}_1{\bf a}_2)=\begin{pmatrix}\lambda_1&0\\0&\lambda_2\end{pmatrix}
となります。


例3.2.2
次は、平面上の原点 O を中心とした回転を考えましょう。
回転運動が一次変換であることは次のようにしてわかります。
f_\theta を原点中心の \theta 回転の写像とします。

このとき、O{\bf x}{\bf y}{\bf x}+{\bf y}
は、ある平行四辺形をなします。

このとき、この平行四辺形を原点 O を中心として
一斉に \theta 回転をしたとすると、

平行四辺形の各点は、
Of_\theta({\bf x}), f_\theta({\bf y}), f_\theta({\bf x}+{\bf y})
に移ります。
平行四辺形は、回転しても平行四辺形ですから、

f_\theta({\bf x}+{\bf y})=f_\theta({\bf x})+f_{\theta}({\bf y}) が成り立ちます。
また、{\bf x}{\bf y} が平行で、平行四辺形が作れない場合は、
つぶれた平行四辺形と考えれば同じことが言えます。

また、\lambda を実数として、{\bf x}\lambda{\bf x} は、\theta 回転しても
してもその関係は変わりません。
というのも、回転というのは、長さと角度を変えないからです。
よって、
f_\theta(\lambda {\bf x})=\lambda f_\theta({\bf x})
となります。

つまり、回転というのは、一次変換ということになります。
f_\theta から定まる (2,2) 行列 R_\theta を求めていきます。

上で求めた方法をとります。
標準基底 {\bf e}_1{\bf e}_2 の像がどうなるかを調べれば
よいことになります。

{\bf e}_1f_\theta による行き先は、\begin{pmatrix}\cos\theta\\\sin\theta\end{pmatrix}であり、
{\bf e}_2f_\theta による行き先は、\begin{pmatrix}-\sin\theta\\\cos\theta\end{pmatrix}
となります。

{\bf a}_1=f_\theta({\bf e}_1)=\begin{pmatrix}\cos\theta\\\sin\theta\end{pmatrix}
{\bf a}_2=f_\theta({\bf e}_2)=\begin{pmatrix}-\sin\theta\\\cos\theta\end{pmatrix}

ですから、R_\theta は、

R_\theta=\begin{pmatrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{pmatrix}
となります。

つまり、\theta 回転を表す行列は
f_\theta({\bf x})=\begin{pmatrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{pmatrix}{\bf x}
となります。


一次変換の合成に対応する、行列は、行列の積となります。
前回やったように、f_B\circ f_A=f_{BA} ですから、
f_{R_{\theta_2}}\circ f_{R_{\theta_1}}=f_{R_{\theta_1}R_{\theta_2}}
また、\theta_1 回転をして、\theta_2 回転をしてできる一次変換は
\theta_1+\theta_2 回転した一次変換ですから、
f_{R_{\theta_2}}\circ f_{R_{\theta_1}}=f_{\theta_1+\theta_2}=f_{R_{\theta_1+\theta_2}}
となります。
よって、この2つから、
R_{\theta_1+\theta_2}=R_{\theta_2}R_{\theta_1}
が成り立ちます。
よって、
\begin{pmatrix}\cos\theta_2&-\sin\theta_2\\\sin\theta_2&\cos\theta_2\end{pmatrix}\begin{pmatrix}\cos\theta_1&-\sin\theta_1\\\sin\theta_1&\cos\theta_1 \end{pmatrix}= \begin{pmatrix}\cos(\theta_1+\theta_2)&-\sin(\theta_1+\theta_2)\\\sin(\theta_1+\theta_2)&\cos(\theta_1+\theta_2) \end{pmatrix}
が成り立ちますが、この式の各成分は、三角関数の加法定理を意味しています。

例3.2.3
直線 y=(\tan\theta)x に沿った鏡映変換を考えましょう。
鏡映変換とは、ある直線による線対称変換を意味します。
この直線 y=(\tan\theta)x による鏡映変換は、

(1) 原点での -\theta 回転、
(2) x 軸による線対称変換、
(3) 原点での \theta 回転

のこの順番による合成になります。

これらは、上の例ですでに見たものばかりです。
x 軸による線対称変換は、x 方向は変わらず (1倍)、y 方向に -1
をする一次変換です。
一次変換の合成も一次変換ですから、
鏡映もやはり一次変換です。

この3つの一次変換を合成することで得られる一次変換を g_\theta とし、
そのときの行列を S_\theta とすると、
S_\theta=R_\theta\begin{pmatrix}1&0\\0&-1\end{pmatrix}R_{-\theta}
となります。
ここで、かける順番に気を付けましょう。
わからなくなったら、f_B\circ f_A=f_{BA}であることと、
一次変換は、左から行列をかけることであったことを思い出しましょう。

よって、S_\theta を実際計算をすると、

S_\theta=\begin{pmatrix}\cos 2\theta&\sin2\theta\\\sin2\theta&-\cos2\theta\end{pmatrix}
となります。
鏡映変換は、線対称変換ですから、2回同じ変換を行うと
元に戻ります。
これは、
g_\theta\circ g_\theta=\text{id}_{{\mathbb R}^2}
であることを示せばよいですが、行列の言葉に直せば、

S_\theta^2=(R_{-\theta}\begin{pmatrix}1&0\\0&-1\end{pmatrix}R_\theta)^2=R_{-\theta}\begin{pmatrix}1&0\\0&-1\end{pmatrix}R_{\theta}R_{-\theta}\begin{pmatrix}1&0\\0&-1\end{pmatrix}R_{\theta}


R_{-\theta}\begin{pmatrix}1&0\\0&-1\end{pmatrix}\begin{pmatrix}1&0\\0&-1\end{pmatrix}R_{\theta}=R_{-\theta}R_\theta=E
よって、g_\theta\circ g_\theta=\text{id}_{{\mathbb R}^2} が示せました。


これらの行列の可換性
これまで、定数倍(x方向とy方向に変倍する)の変換、
回転、鏡映変換などを考えました。
これらの変換やその合成も一次変換です。

回転による変換同士は可換であることはわかります。
足し算の可換性が成り立つから、

R_{\theta_1}R_{\theta_2}=R_{\theta_1+\theta_2}=R_{\theta_2+\theta_1}=R_{\theta_2}R_{\theta_1}
となり可換です。

x 方向に \lambda_1 倍、 y 方向に \lambda_2 倍する一次変換を
する行列を T_{\lambda_1,\lambda_2} としますと、
T_{\lambda_1,\lambda_2}R_{\theta}=\begin{pmatrix}\lambda_1\cos\theta&-\lambda_1\sin\theta\\\lambda_2\sin\theta&\lambda_2\cos\theta\end{pmatrix}
R_{\theta}T_{\lambda_1,\lambda_2} =\begin{pmatrix}\lambda_1\cos\theta&-\lambda_2\sin\theta\\\lambda_1\sin\theta&\lambda_2\cos\theta\end{pmatrix}

よって、(2,1) 成分を比べることによって、
T_{\lambda_1,\lambda_2}R_\theta=R_\theta T_{\lambda_1,\lambda_2}
が成り立つためには、\lambda_1=\lambda_2 でなければなりません。
また、\lambda_1=\lambda_2=\lambda であれば、 つまり、T_{\lambda,\lambda} は原点 O を中心とした、\lambda 拡大を表します。

また、T_{\lambda,\lambda}=\lambda E であり、
スカラー倍は R_{\theta} などあらゆる一次変換と可換ですから、
T_{\lambda,\lambda}R_{\theta} は可換となります。

直交変換
ここで、直交変換を定義し、対応する行列の性質を考察して終わります。
直交変換とは、長さを変えない一次変換ことを言います。
f を直交変換とし、{\bf e}_1{\bf e}_2 を上記の標準基底とします。

このとき、{\bf e}_1{\bf e}_2 の長さは 1 ですから、
f({\bf e}_1)=\begin{pmatrix}a\\b\end{pmatrix}
f({\bf e}_2)=\begin{pmatrix}c\\d\end{pmatrix} としますと、
a^2+b^2=1 かつ c^2+d^2=1 が成り立ちます。

また、長さを変えないということは、角度(の絶対値)も変えないということです。
どうしてかというと、

三角形 OAB を考えます。O は原点、A,B はそれ以外の点とします。
そうすると、直交変換は長さを変えないのだから、この三角形 OAB
OAB と合同な三角形 OA'B' に移ります。
ここで、一次変換であることから、原点は原点に移ります。
(なぜなら O の表すベクトルを {\bf 0} とすると
 f({\bf 0})=f(2{\bf 0})=2f({\bf 0})より、f({\bf 0})={\bf 0} となるからです。)
よって、角 AOBA'OB' に移ります。
ただし、三角形 OAB が裏返るかもしれないので、角度の絶対値
は変わりません。

よって、\begin{pmatrix}a\\b\end{pmatrix} と  \begin{pmatrix}c\\d\end{pmatrix}
は直交しなければなりません。

つまり、内積は0なので、ac+bd=0 となります。
ここで、R=\begin{pmatrix}a&c\\b&d\end{pmatrix} とすると、
^tRR=\begin{pmatrix}a^2+b^2&ac+bd\\ac+bd&c^2+d^2\end{pmatrix}

が成り立ち、この右辺はちょうど単位行列 E となります。
つまり、直交変換 f の表す行列 R は、^tRR=E となります。

このような行列 R のことを直交行列といいます。