[場所:manaba上(水曜日12:00〜)]
数学リテラシー3回目です。
今日から行列や一次変換についての説明に入ります。
行列というのは、高校では習わなかった対象だと思います。
(一部の高等学校では教育課程を逸脱して教えているところもあるようですが...)
しかし、行列は大学では線形代数の話でさらっと登場し、
その後の数学の学習にはなくてはならない対象になります。
数学に限らず、科学の基礎の部分でどの分野に進んでも
そのテクニックを使うことになるでしょう。
私が受験生のころは行列も高校までの範囲に入っていましたので
「代数・幾何」という授業のなかで行列や一次変換を
勉強をしたことを鮮明に覚えています。ちょっと変わった代数だなと思っただけで、
その意味まではよくわかっていませんでした。
しかし、大学に入って線形代数を系統的に学び、連立一次方程式を解いたり、
固有値を用いて、いとも簡単に線形常微分方程式が解けたりなど
様々な応用があることが分かってその奥深さに面白さを感じました。
2次関数を平行移動したりすることは今でも高校で習うと思いますが、
一方、行列を使えば、図形を回転させた時にそれがどのように移るか?
ということも調べることができます。
なので、これからの講義を聞いた後であれば、
例えば、y=x^2 という2次関数を30度回転させたときに
図形がどのような方程式を満たすかなど計算できるようになります。
今日は、行列の四則演算について学びますが、
今日以降の学習のどこかで、図形を変形させる変換として考え
たりもします。
そのような変換のことを一次変換といいます。
行列を使うことによって、図形を拡大させたり、回転させたり、
相似拡大をしたりするのも一次変換です。
また、ある方向に歪ませたりする操作、
たとえば、正方形を平行四辺形に歪ませるようなことですが、
これも一次変換です。
これらの変換を組み合わせたり、合成したりしたものも一次変換です。
(実は逆に、行列とは、上のような操作を合成したものと考えることもできるのですが
それはどこかでおいおいと...)
今回は行列についての最初の基本的な知識についてです。
全体で7つに分かれています。
では、はじめていきましょう。
Part 1: 行列の定義、行列の成分
行列とは縦に m 個、横に n 個だけ長方形状に数を並べたものをいいます。
そのような行列のことをm 行 n 列の行列といったり、
m\times n 行列といったり、(m,n) 行列と言ったりします。
下の例では、縦に3 個、横に4個の数を長方形の形に並べたものですから、(3,4) 行列の例です。
\begin{pmatrix}1&2&3&4\\5&6&7&8\\9&10&11&12\end{pmatrix}
このとき、第1行目とは、
\begin{pmatrix}1&2&3&4\end{pmatrix}
をさし、
第2行目とは、
\begin{pmatrix}5&6&7&8\end{pmatrix}
のことをさします。第 3 行目はも同様に考えれば
もうわかりますね。
もうわかりますね。
また、第1列目といえば、
\begin{pmatrix}1\\5\\9\end{pmatrix}
のことであり、第3列目といえば、
\begin{pmatrix}3\\7\\11\end{pmatrix}
のことを指します。
このように、行といえば、横に並んだ数のことをいい、
列といえば、縦に並んだ数のことをいいます。
また、とりわけ、m=n のときは、正方形的に数が並ぶため、
正方行列といいます。この場合、n 次正方行列ともいいます。
行列に並んでいる、mn 個のそれぞれの数のことを成分と言います。
j 番目にいる成分を、(i,j) 成分といいます。
例えば、上の 3\times 4 行列の (1,3) 成分は 3 ということになります。
同じように考えることで、(3,4) 成分は、12ということになります。
まずは、このような言い方に慣れてください。
例えば、以下はうちにある衣装ケースですが、これは、3\times 2 行列
と考えられます。
黄色いシールは成分の名前(例えば (1,2) を書いており、貼り付けています。
あなたのうちにもこのようなケースやタンスがあれば、一つ一つ指をさして、
ここが、(1,2) 成分、ここが、(2,3) 成分などと確認しながら
ここが、(1,2) 成分、ここが、(2,3) 成分などと確認しながら
言ってみるのもよいでしょう。
また、A という行列の (i,j) 成分を a_{ij} のように書くことがあります。
3\times 4 行列の場合、
\begin{pmatrix}a_{11}&a_{12}&a_{13}&a_{14}\\a_{21}&a_{22}&a_{23}&a_{24}\\a_{31}&a_{32}&a_{33}&a_{34}\end{pmatrix}
となります。この並びを見ながら、2つの数字の組み合わせ (i,j) がどのように
移り変わっているかを追ってみると、数え方がわかるようになるかもしれません。
移り変わっているかを追ってみると、数え方がわかるようになるかもしれません。
このような行列 A を、(a_{ij}) のように書くことがあります。
Part 2: 行列の略記、行列全体の集合
さきほど、最後に書いたように、A の (i,j) 成分が a_{ij} となる行列
を (a_{ij}) のように書きました。
他の書き方として、(a_{ij})_{1\le i,j\le n} のように書くこともあります。
また、i と j の間にコンマを入れて、a_{i,j} のように書くこともあります。
これは、例えば、a_{121} と書いてしまったとき、(12,1) 成分なのか、(1,21) 成分なのかわからないからですが、数字が2つまでしか並ばないのなら
コンマはなくてもわかります。
コンマはなくてもわかります。
また、n=1 のとき、m\times 1 行列は、縦に並んだ一直線の行列
\begin{pmatrix}a_{11}\\\vdots\\a_{m1}\end{pmatrix}
\begin{pmatrix}a_{11}\\\vdots\\a_{m1}\end{pmatrix}
ですが、このような行列をベクトルということがあります。
とりわけ、この場合は縦ベクトルといいます。
また、m=1 のとき、1\times n 行列とは、横に並んだベクトル
とりわけ、この場合は縦ベクトルといいます。
また、m=1 のとき、1\times n 行列とは、横に並んだベクトル
\begin{pmatrix}a_{11}&\cdots&a_{1n}\end{pmatrix}
を表すことになります。
こちらは横ベクトルともいいます。
こちらは横ベクトルともいいます。
また、普通の数 1 や \sqrt{2} なども、カッコをつけて、
(1) や (\sqrt{2}) のように表しておくことで (1,1) 行列ということもあります。
この場合、カッコをつけているだけで、実数を考えていることと
何ら変わりはありません。
この場合、カッコをつけているだけで、実数を考えていることと
何ら変わりはありません。
(m,n) 行列を全て集めることで、集合を作ることができます。
この集合、つまり、
\{A|A\text{ は全ての成分が実数となる $m\times n$ 行列}\}
を M(m,n,{\mathbb R}) と書きます。成分が全て実数の行列の集合ですのでこのように
書きますが、成分が複素数であれば、{\mathbb C} を用いて、M(m,n,{\mathbb C})
となります。
正方行列の場合は、M(n,n,{\mathbb R}) のように n を2回続けて書く必要もない
と感ずれば、M(n,{\mathbb R}) と書くこともあります。
正方行列の場合は、M(n,n,{\mathbb R}) のように n を2回続けて書く必要もない
と感ずれば、M(n,{\mathbb R}) と書くこともあります。
Part 3: 行列の相等・行列の加法、零行列
次に、行列の四則演算について行います。
これ以降、行列の成分は全て実数として扱います。
複素数や他の数体を用いてもよいですが、本質的には違いはありません。
実数の次の四則演算(加法、減法、乗法、除法)を思い出しましょう。
四則演算とは、
a+b,\ a-b,\ a\times b,\ a\div b
のことでした。これらの法則は、
a+b=b+a (加法の交換法則)
(a+b)+c=a+(b+c) (分配法則)
a\times (b+c)=a\times b+a\times c (加法の結合法則)
を満たします。
また、実数 0 は、0+a=a+0=a などの性質を満たします。
このような性質をもつ 0 のことを零元もしくは加法の単位元と言います。
そのような単位元が存在することを、加法の単位元の存在といいます。
また、実数 a に対して、 -a とは、a+(-a)=0 を満たす実数を表します。
たとえば、a=3 に対しては、-a とは、3 のことを表し、
a=-2 に対して、-a=2 とし、a=0 に対しては、-a=0 とすると、
上の関係 a+(-a)=0 が成り立ちます。
上の関係 a+(-a)=0 が成り立ちます。
a に対して、-a が存在することになりますが、
a に対する -a のことを a の逆元といいます。
a に対する -a のことを a の逆元といいます。
このように各 a に対して -a が存在することを 加法の逆元の存在
といいます。
といいます。
今、A,B\in M(m,n,{\mathbb R}) に対して、A と B の加法を定義します。
A=(a_{ij}) と B=(b_{ij}) とします。
この記号は、(i,j) 成分がそれぞれ、a_{ij} であり、b_{ij} となる
行列ということでした。
このとき、(m,n) 行列 A+B を (a_{ij}+b_{ij}) と定義します。
つまり、成分ごとに和を取るということです。
例えば、
A=\begin{pmatrix}1&2&3\\4&5&6\end{pmatrix},\ B=\begin{pmatrix}7&8&9\\10&11&12\end{pmatrix}
とすると、
A+B=\begin{pmatrix}1+7&2+8&3+9\\4+10&5+11&6+12\end{pmatrix}
=\begin{pmatrix}8&10&12\\14&16&18\end{pmatrix}
となります。
このような成分同士足して得られる和は、ベクトルと同じですね。
2つのベクトル (a,b,c) と (d,e,f) の和は、(a+d,b+e,c+f) のように
成分同士たすのでした。
つまり、行列は、mn 個の実数の集まりをあたかもベクトルだと思って
和をとったものが行列の和ということになります。
ですので、2つの行列の和ができるためには、
その行列の2つのサイズが一致していないといけません。
その行列の2つのサイズが一致していないといけません。
つまり、A,B がどちらも m\times n 行列でないと、A+B ができません。
上でいう、実数は加法の単位元が存在することから、
行列も加法の逆元が存在します。
全ての成分が0になる行列を
行列も加法の逆元が存在します。
全ての成分が0になる行列を
O=\begin{pmatrix}0&0&\cdots& 0\\\cdots &\cdots&\cdots&\cdots \\0&0&\cdots &0\end{pmatrix}
として定義してやると、これは、ベクトルでいう零ベクトルであることに対応し、
A+O=O+A=A が成り立ちます。
この行列のことを O と零行列といいます。
A+O=O+A=A が成り立ちます。
この行列のことを O と零行列といいます。
このように単に O として書くと、サイズがどのような零行列かわからないと思う
かもしれませんが、A と同じサイズの全ての成分が 0 の行列ということになります。
ややこしくなる場合なら、O_{m,n} のように、しておけば、(m,n) 行列の
零行列とするのが良いかもしれません。
また、A\in M(m,n,{\mathbb R}) に対して、-A を全ての成分がA の成分の
マイナス1倍として定義しておきます。
つまり、A=(a_{ij}) としたときに、-A を (-a_{ij}) として定義するのです。
つまり、A=(a_{ij}) としたときに、-A を (-a_{ij}) として定義するのです。
このとき、成分同士の和をとることで、A+(-A)=O が成り立ちます。
A+B=B+A,
A+(B+C)=(A+B)+C,
A+O=O+A=A,
A+(-A)=O
A+(-A)=O
また、行列の相等というのは、2つの行列が等しい時はいつか?
という問題ですが、A=(a_{ij}) とB=(b_{ij}) が
等しいということは、各成分が等しいということ、
つまり、任意の i,j に対して、a_{ij}=b_{ij} が成り立つこと
として定義します。
Part 4: 行列の乗法
次に行列の乗法について説明をします。
ベクトルには、行列の加法と乗法がありましたが、乗法は
ありませんでした。
しかし、行列には乗法を考えることができます。
ただし、しかるべき条件が必要です。
A\in M(m,n,{\mathbb R}) と、B\in M(n,k,{\mathbb R}) に対して、
その積 A\cdot B を定義することができます。
この積を表すドット \cdot は以下しばしば省略されることがあります。
この積を表すドット \cdot は以下しばしば省略されることがあります。
ここで、A の列の数と B の行の数が一致していることが条件です。
ここで得られる A\cdot B=C は、(m,k) 行列とになります。
丁度、2つの行列のサイズでかぶっていた n が消去されて、
C の行数は A の行数であり、C の列数は B の列数となります。
(m,n) 行列 A と (n,k) 行列 B に対して、(m,k) 行列
C=A\cdot B の、(i,j) 成分を
\sum_{p=1}^na_{ip}b_{pj}
として定義します。つまり、公式として書くならば
C=(\sum_{p=1}^na_{ip}b_{pj})
ということになります。
積の公式はこれですが、実際理解するには、何回か
積の練習をする必要があります。
例えば、m=n=k=3 の時を考えてみましょう。
A=(a_{ij}) とし、B=(b_{ij}) とします。
このとき、
C=A\cdot B=\begin{pmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{pmatrix}\begin{pmatrix}b_{11}&b_{12}&b_{13}\\b_{21}&b_{22}&b_{23}\\b_{31}&b_{32}&b_{33}\end{pmatrix}
を計算します。
C もまた、(3,3) 行列となるのですが、
その、(i,j) 成分がどのようになるかをみてみましょう。
例えば、(1,2) 成分ですが、 A の第1行目、 B の第2列目をとります。
それぞれ \begin{pmatrix}a_{11}&a_{12}&a_{13}\end{pmatrix} と\begin{pmatrix}b_{21}\\b_{22}\\b_{23}\end{pmatrix} となりますが、
これらの内積を考えます。
つまり、対応する成分同士の積をとり、足し上げるのです。
結果的に、
a_{11}b_{21}+a_{12}b_{22}+a_{13}b_{32}
となります。
これが、C の (1,2) 成分となります。
同じように続けます。
他にも、例えば、C の (2,3) 成分を計算するには、
他にも、例えば、C の (2,3) 成分を計算するには、
A の第2行目と B の第3列目をとります。
このとき、それぞれ \begin{pmatrix}a_{21}&a_{22}&a_{23}\end{pmatrix} と \begin{pmatrix}b_{13}\\b_{23}\\b_{33}\end{pmatrix} となりますが、
この対応する成分同士の積を考えてそれらを全て足すと、
C の第 (2,3) 成分は、
a_{21}b_{13}+a_{22}b_{23}+a_{23}b_{33}
となります。つまり、(i,j) 成分は、
a_{i1}b_{1j}+a_{i2}b_{2j}+ a_{i3}b_{3j}=\sum_{k=1}^3a_{ik}b_{kj}
となるわけです。
講義の方にも、教科書の方でも問題がいくつかあるので自分で練習してみてください。
例えば、
\begin{pmatrix}1&2&-1\\2&-4&3\end{pmatrix}\begin{pmatrix}3&2\\3&4\\2&3\end{pmatrix}=\begin{pmatrix}7&7\\0&-3\end{pmatrix}
などとなります。この計算も自分で確かめてみてください。
また、この行列の積の順番を入れ替えたとき、
\begin{pmatrix}3&2\\3&4\\2&3\end{pmatrix}\begin{pmatrix}1&2&-1\\2&-4&3\end{pmatrix}=\begin{pmatrix}7&-2&3\\11&-10&9\\8&-8&7\end{pmatrix}
となります。この例から分かる通り、積に関して AB=BA が成り立ちません。
そもそも行列のサイズさえ合っていません。
通常の実数は積は入れ替えても答えは同じですからそのことを
実数の積は可換であるといいます。
可換ではないような積をもつ場合は非可換といいます。
上で見た通り、行列の積は非可換です。
しかし、その理由が行列のサイズの問題だけであるとすれば、
行も列の一致している正方行列のときを考えるとどうでしょうか?
ところが、たとえ、A,B が正方行列であっても可換ではありません。
通常の実数は積は入れ替えても答えは同じですからそのことを
実数の積は可換であるといいます。
可換ではないような積をもつ場合は非可換といいます。
上で見た通り、行列の積は非可換です。
しかし、その理由が行列のサイズの問題だけであるとすれば、
行も列の一致している正方行列のときを考えるとどうでしょうか?
ところが、たとえ、A,B が正方行列であっても可換ではありません。
例えば、
A=\begin{pmatrix}1&1\\0&1\end{pmatrix},\ B=\begin{pmatrix}1&0\\1&1\end{pmatrix}
とすると、
AB=\begin{pmatrix}2&1\\1&1\end{pmatrix}
BA=\begin{pmatrix}1&1\\1&2\end{pmatrix}
となり、やはり、AB\neq BA となります。
よって、正方行列だけに制限したとしても、行列は積に関して非可換である
ということになります。
ということになります。
しかし、全ての A,B に対していつでも AB\neq BA というわけではありません。
たとえば、次のような例を
A=\begin{pmatrix}1&2\\2&1\end{pmatrix}
B=\begin{pmatrix}1&-1\\-1&1\end{pmatrix} とすると
AB=BA=\begin{pmatrix}-1&1\\1&-1\end{pmatrix}
となり、この場合は2つの行列は可換となります。
ある積の演算を持った集合(例えば整数や実数や正方行列など)
が積において可換であるというのは、
が積において可換であるというのは、
そのような集合の全ての元 A,B に対していつでも可換、つまり AB=BA を
満たさなければならないということに注意してください。
非可換であるということは、つまり可換を否定しているワケだから、
最初の論理の時にもやりましたが、
一つでも非可換な A,B があれば、その集合は非可換であるということになります。
なので、上で非可換な A,B の例を挙げたことから、
行列 M(2,{\mathbb R}) は非可換な積をもつ集合であるということになります。
実際、n>1 であれば、M(n,{\mathbb R}) は可換ではありません。
非可換であるということは、つまり可換を否定しているワケだから、
最初の論理の時にもやりましたが、
一つでも非可換な A,B があれば、その集合は非可換であるということになります。
なので、上で非可換な A,B の例を挙げたことから、
行列 M(2,{\mathbb R}) は非可換な積をもつ集合であるということになります。
実際、n>1 であれば、M(n,{\mathbb R}) は可換ではありません。
Part 5: 行列の結合法則、分配法則
行列は、実数の加法の性質から、自然に行列の加法に関するいくつかの法則が
導かれました。
加法の可換性や、加法の結合法則や加法の単位元の存在などです。
今、上で行列の積を定義しましたが、実数の積の法則で、
行列の積でも同じ法則が成り立つ部分がありますのでそれを説明しておきます。
上では実数では成り立つ、積の可換性は行列では成り立たない
上では実数では成り立つ、積の可換性は行列では成り立たない
ことも示しました。
それ以外の法則をみてみますと、
a,b,c を実数とするとき、
(ab)c=a(bc) (積の結合法則)
(a+b)c=ac+bc (分配法則1)
a(b+c)=ab+ac (分配法則2)
が成り立ちますが、実は、行列でも、
A\in M(m,n,{\mathbb R}) かつ B\in M(n,l,{\mathbb R}) かつ C\in M(l,p,{\mathbb R}) であるとすると、
A(BC)=(AB)C (積の結合法則)
A,B\in M(m,n,{\mathbb R}) かつ C\in M(n,l,{\mathbb R}) であるとすると、
A\in M(m,n,{\mathbb R}) かつ B\in M(n,l,{\mathbb R}) かつ C\in M(l,p,{\mathbb R}) であるとすると、
A(BC)=(AB)C (積の結合法則)
A,B\in M(m,n,{\mathbb R}) かつ C\in M(n,l,{\mathbb R}) であるとすると、
(A+B)C=AC+BC (分配法則1)
が成り立ちます。
A\in M(m,n,{\mathbb R}) かつ B,C\in M(n,l,{\mathbb R}) であるとすると、
A(B+C)=AB+AC (分配法則2)
が成り立ちます。
この証明はそれぞれに行うことができますが、とりあえず
最初の結合法則だけ証明しておきます。
基本的に、実数の場合の証明がそのまま受け継がれるというものです。
A=(a_{ij})\in M(m,n,{\mathbb R}),\ B=(b_{ij})\in M(n,l,{\mathbb R}),\ C=(c_{ij})\in M(l,p,{\mathbb R}) とします。
このとき、
A(BC)=(a_{ij})(\sum_{k=1}^lb_{ik}c_{kj})=(\sum_{q=1}^na_{iq}\sum_{k=1}^lb_{qk}c_{kj})
=(\sum_{q=1}^n\sum_{k=1}^la_{iq}b_{qk}c_{kj})=(\sum_{q=1}^na_{iq}b_{qk}\sum_{k=1}^lc_{kj})
=(\sum_{q=1}^na_{iq}b_{qj})(c_{ij})=((a_{ij})(b_{ij}))(c_{ij})
=(AB)C
となります。
Part 6: 行列の分配法則の証明
分配法則について証明しておきます。
ここでは、分配法則の2について示しておきます。
講義の方では1の方を示しています。
講義の方では1の方を示しています。
A\in M(m,n,{\mathbb R}) かつ B,C\in M(n,l,{\mathbb R}) であるとき、
A(B+C)=AB+AC
を示します。
A=(a_{ij}), B=(b_{ij}), C=(c_{ij}) とします。
A(B+C)=A(b_{ij}+c_{ij})=(\sum_{k=1}^na_{ik}(b_{kj}+c_{kj}))
=(\sum_{k=1}^na_{ik}b_{kj}+\sum_{k=1}^na_{ik}c_{kj})
=(\sum_{k=1}^na_{ik}b_{kj})+(\sum_{k=1}^na_{ik}b_{kj})
=AB+AC
となります。
これらの証明を読む時に気をつけて欲しいことは、
なんとなく読み飛ばすのではなく、一つ一つ何を適用したのかを
考えていくことが大切です。
一つ一つのステップは、実数の演算の法則や行列の和や積の定義や
単なる並び替えなどしか使っていません。
Part 7: 行列の転置
(m,n) 行列 A=(a_{ij}) に対して、(i,j) 成分を、A の (j,i) 成分 a_{ji}
であるような行列 (a_{ji}) をその転置行列といい、 ^tA (もしくは A^T) と書きます。
このとき、転置行列 ^tA は (n,m) 行列になります。
例えば、A=\begin{pmatrix}1&2&3\\4&5&6\end{pmatrix} ならば、
^tA=\begin{pmatrix}1&4\\2&5\\3&6\end{pmatrix}
となります。
を示します。
A=(a_{ij}), B=(b_{ij}), C=(c_{ij}) とします。
A(B+C)=A(b_{ij}+c_{ij})=(\sum_{k=1}^na_{ik}(b_{kj}+c_{kj}))
=(\sum_{k=1}^na_{ik}b_{kj}+\sum_{k=1}^na_{ik}c_{kj})
=(\sum_{k=1}^na_{ik}b_{kj})+(\sum_{k=1}^na_{ik}b_{kj})
=AB+AC
となります。
これらの証明を読む時に気をつけて欲しいことは、
なんとなく読み飛ばすのではなく、一つ一つ何を適用したのかを
考えていくことが大切です。
一つ一つのステップは、実数の演算の法則や行列の和や積の定義や
単なる並び替えなどしか使っていません。
Part 7: 行列の転置
(m,n) 行列 A=(a_{ij}) に対して、(i,j) 成分を、A の (j,i) 成分 a_{ji}
であるような行列 (a_{ji}) をその転置行列といい、 ^tA (もしくは A^T) と書きます。
このとき、転置行列 ^tA は (n,m) 行列になります。
例えば、A=\begin{pmatrix}1&2&3\\4&5&6\end{pmatrix} ならば、
^tA=\begin{pmatrix}1&4\\2&5\\3&6\end{pmatrix}
となります。
0 件のコメント:
コメントを投稿