空論上の砂、楼閣上の机。

The Castle of Indolence

確率・統計 §1. イントロダクション

注意

数学研究部で統計をやろうかどうか迷っているので講義録を書いてみようと思いました. ところがTeXファイルでひたすらガーッと書きまくって完成してしまうような若い時代はもう終わってしまいました. 完全に耄碌してしまいました. ですから, ブログにちょこちょこ書いていくことにしようと思います. 三日坊主に終わるかもしれません. なので続きを期待することはしないほうがいいと思います. でも頑張って更新しようと思います.

今回の参考文献は,

です.

$\sigma$ 加法族の定義は, 中学生には大変むずかしいものです. 演習問題をゆっくりと一緒に手を動かさないと絶対についていけなくなります. 集合算の確認とともにジックリ見るのがいいと思います.

はじめに

突然ですが京都大学の問題を見てみましょう.

京大・文 (1980)

A君は次のように考えた.

「さいころを 6 回振ることにする. $m = 1 , 2 , 3 , 4 , 5 , 6$ のおのおのについて, $m$ 回目に 1 の目が出る確率は $\dfrac{1}{6}$ である. したがって、 6 回のうちに少なくとも 1 回は 1 の目が出る確率は, $$\dfrac{1}{6}+\dfrac{1}{6}+\dfrac{1}{6}+\dfrac{1}{6}+\dfrac{1}{6}+\dfrac{1}{6} = 1$$である. すなわち, さいころを 6 回ふれば少なくとも 1 回は 1 の目が出る.」

A君の考えは正しいかどうかをいえ. もし正しくないならば, 誤りの原因を, なるべく簡潔に指摘せよ.

まず実験してみましょう. この論理だと普通の鉛筆や消しゴムを転がすのと同じですから, 6 回転がしてみましょう. まあ恐らく出ない目があるはずです. もし全部出たなら何回か試してみましょう. もしそれでも全部出続けるなら, あなたはそう遠くない未来に不運なことに直面すると思います.

みなさんは中学受験を経験していますから, 「サイコロを 6 回振って少なくとも 1 回は 1 の目が出る確率」を$$1-\left(\frac{5}{6}\right) ^ 6=\frac{31031}{46656}$$とすぐ計算できるはずです. でもそれだけでは少し物足りない気がします. まず, なぜA君は間違っているのか ということを答えるのが問題でした. そして なぜこの計算が正しいのか ということも同様に A 君からすれば全くよくわからないことです.

この問に巷では次のような解答が出されています.

解答1. A 君の考えは誤りである. 各回でサイコロをふる試行は独立試行であり, 他の回の影響を受けない. 独立な事象が同時に起きる確率は, 各事象が起きる確率の積であるから, 和をとるのは誤りである.
解答2. 正しくない. 1 ~ 6 回目の各回に, 1 の目が出るという事象は互いに排反ではないから, 各回における 1 の目の出る確率を加えることには意味がない.

どうですか? 納得できましたか? ちなみに僕は納得できないです. 僕が仮に中 1 のときに戻ったとして, 本当にナイーブな見方でこの解答を見てみたらこうなると思います.

まず解答1. 「各回でサイコロをふる試行は独立試行であり, 他の回の影響を受けない.」ってのはまあわかります. けど, 「独立だから他の回の影響を受けない」のでしょうか? そもそも「独立」ってどこから分かったんでしょうか? 「独立」って何なんでしょうか? 「無関係」ってこと? とするとたとえば「 2 以下の目が出る」と「奇数の目が出る」というのは独立じゃない……ってことですよね (違います. 独立です). あ, でもこれって「事象」であって「試行」ではないのか. 結局「独立」ってなんなの? まあそれはいいとして……ええと, 「独立な事象が同時に起きる確率は, 各事象が起きる確率の積であるから, 和をとるのは誤りである.」? A君って「少なくとも 1 回は出る確率」を求めようとしたのに, それって「独立な事象が同時に起きる確率」と言っていいんですか? よくわからないなぁ……

次に解答2. 「互いに排反」ってのは何だ? えーと, 「ある試行の結果として起こるいくつかの事象があって, それらのうちの1つが起これば, 他は決して起こらないとき, それらの事象は互いに排反であるという」らしい. たしかに最初に 1 の目が出ても, そっからの 5 回でまた 1 が出てもOKですね. 互いに排反っぽい. だから……え? だから「各回における 1 の目の出る確率を加えることには意味がない」……? なんでそこが「だから」でつながるの? 「ナンセンスだから誤り!」ってのはわかるけど, なんで?

こうやって僕は確率や場合の数が嫌いになりました. もしみなさんが上のような解答で全く誤解の余地なくわかるなら, 来る必要も読む必要もありません. ですが, 今から展開する (ひたすら泥臭くて抽象度の高い) 体系に食らいつけば, 確率に対してクリアな視点が持てると思います. 問題がすぐに解けなくてもいいんです. 中学生のうちぐらいはのびのびと自分の好きなことをしてください.

老婆心もしつこいとウザいですから, さっそく始めましょう.

準備

集合論は数オリ講義でもさんざんやってると思うので省略します. 知りたかったら, 適当に高校数学Iの教科書を引っ張り出して読んどいてください. なかったら, なんか高校数学の参考書ぐらい一冊持っといたほうが人生困らないと思います. 『総合的研究』でも『新数学 Plus Elite』でもいいですから. チャート式は買わない方がいいと思います.

まず凡例を.

  • $\varnothing$ で空集合.
  • $x\in X$ で「$x$ は集合 $X$ の元である.」
  • $\exists x\in X$ で「ある $X$ の元 $x$ が存在して,」「$X$ のある元 $x$ に対して,」「$X$ に……という元 $x$ が存在する.」
  • $\forall x\in X$ で「$X$ の任意の元 $x$ に対して.」
  • $X\subset Y$ で「集合 $X$ は集合 $Y$ の部分集合.」この定義は, $X$ の元はすべて $Y$ の元であることでした. 高校ではあまり強調されませんが, 常識なのですぐ言えるようにしておいてください.
  • $X\cap Y$ で「集合 $X$, $Y$ の共通部分.」
  • $X\cup Y$ で「集合 $X$, $Y$ の和集合.」
  • $X\setminus Y$ で「$X$ と $Y$ の差集合.」すなわち $\lbrace x\in X\mid x\notin Y\rbrace$.
  • $f\colon X\to Y$ で「$f$ は $X$ から $Y$ への写像.」高校では「関数」と呼ばれますが, 似たようなものです.
  • $\mathbb{N}$ は自然数 (正の整数) 全体の集合.
  • $\mathbb{Z}$ は整数全体の集合.
  • $\mathbb{Q}$ は有理数全体の集合.
  • $\mathbb{R}$ は実数全体の集合.
  • $[a,b]$ は閉区間 $ \lbrace x\in\mathbb{R}\mid a\leqq x\leqq b \rbrace$
  • $[a,b)$ は半開区間 $ \lbrace x\in\mathbb{R}\mid a\leqq x\lt b \rbrace$
  • $(a,b]$ は半開区間 $ \lbrace x\in\mathbb{R}\mid a\lt x\leqq b \rbrace$
  • $(a,b)$ は開区間 $ \lbrace x\in\mathbb{R}\mid a\lt x\lt b \rbrace$

さて, 1学期はロクに説明しませんでしたが, 無限大を導入しておきましょう. 四則演算もできるようにしておきます.

定義1.1

実数全体の集合 $\mathbb{R}$ に, 2つの記号 $+\infty$, $-\infty$ を付け加えた集合 $ \bar { \mathbb{R} } = \mathbb{R} \cup \lbrace + \infty, - \infty \rbrace $ を考え, 任意の $a\in\mathbb{R}$ に対して $-\infty\lt a\lt +\infty$ とすることによって $\bar{\mathbb{R}}$ における大小関係を定める. $+\infty$ を正の無限大または単に無限大といい, $-\infty$ を負の無限大という.

$\pm\infty$ を含む和と積と差を

$$\pm\infty+a=a+\pm\infty=\pm\infty\quad(a\in\bar{\mathbb{R}},a{\,=}\mathllap{/\,} \mp\infty)$$
$$(\pm\infty)\cdot a=a\cdot(\pm\infty)=\begin{cases}\pm\infty &(a\gt 0),\\\mp\infty &(a\lt 0)\end{cases}$$
$$a-b=a+(-1)\cdot b$$で定める. また $(\pm\infty)^{-1}=0$ として商を$$\dfrac{a}{b}=a\cdot b^{-1}$$と (右辺が定義される限りにおいて) 商を定める.

定義1.2

集合 $X$ が可算 (無限) であるとは, 全単射 $\mathbb{N}\to X$ が存在することをいう. また $X$ が可算または有限であるとき, 高々可算という.

演習1.3

$\mathbb{Z}$ は可算.

演習1.4

$\mathbb{Q}$ は可算.

演習1.5

$\mathbb{R}$ は非可算.

1.3, 1.4 は普通にわかると思います. 1.5 は初見だとわかんないと思います. ググるときは「対角線論法」で調べるといいでしょう.

確率空間

今までの話はすべて集合や実数の話だったので, おそらく本質的につまづくところはなかったと思います. ここからようやく「確率とは何か?」という話に入っていきます. まず最初に述べておくと, 現代数学は「〜〜とは何か」という問をできるだけ排除してモデルを作ることで発展してきたという事実があります. どういうことか? 現代的には20世紀に入って Kolmogorov という数学者が与えた定義が採用されているのですが, でも別に「それこそが確率である!」と主張しているわけではありません. 「確率ってこういうふうに定めたらうまくいくんじゃないかな」というノリで, 実際使ってみたらイケたから, どんどん使っていこうとなっているわけです. 定義することと, 面白い数学的対象を扱えることとは, 別の問題です.

焦らしても仕方ないので結論を先に出しましょう. まずある集合 $\Omega$ を持ってきます. こいつの部分集合を集めてきて集合を作ります. その中でイイ感じのやつ $\mathcal{F}$ を選んで, イイ感じの $P\colon\mathcal{F}\to\mathbb{R}$ を選びます. この三つ組 $(\Omega, \mathcal{F}, P)$ が確率の住処, 確率空間, というわけです. 意味分かんないですよね. 僕も中2のころにこれを見て「それでなに?」ってなりました. ただひとまず, 今回は我慢して定義を地道に追ってみましょう. 初対面は誰でも緊張して上手く使えないので, そのうち分かればいいか, ぐらいの心持ちでいいと思います.

以下, 空でない集合を一つ取り $S$ として固定します.

定義2.1 ($\sigma$加法族)

$S$ の部分集合の集合族 $\mathcal{M}$ が以下の性質を満たすとき, $\mathcal{M}$ は ($S$上の) $\sigma$加法族 であるという.

1. $\varnothing\in\mathcal{M}$

2. $A\in\mathcal{M}\Rightarrow A ^ {\complement}\in\mathcal{M}$

3. $\displaystyle A_n\in\mathcal{M}\,(n\in\mathbb{N})\Rightarrow\bigcup_{n=1}^{\infty} A_n\in\mathcal{M}$

注. あくまでも可算個の和集合についてのみ保証していることに気をつけましょう. 非可算個の場合については何も言っていません.
定義2.2 (可測空間)

組 $(S,\mathcal{M})$ を可測空間という. $\mathcal{M}$ の元を可測集合という.

演習2.3

可測空間 $(S,\mathcal{M})$ に対し次が成り立つ.

1. $S\in\mathcal{M}$

2. 有限個の和集合 (の操作) について閉じている.

3. 高々可算の積集合について閉じている.

4. 差集合について閉じている

ヒント. 1. 当たり前. 2. 当たり前. 3. ド・モルガンの法則は高校範囲です. 4. $A\setminus B=A\cap B ^ {\complement}$ でした.

つまり, 集合に対して普段使うような演算は高々可算個ならOKという, 割と強めな定義であることがわかりました. では可測空間の (カンタンに作れる) 例を見てみましょう.

例2.4

$\mathcal{M}_0=\{\varnothing, S\}$ は $\sigma$ 加法族であり, 自明な $\sigma$ 加法族という.

例2.5

$X$ の部分集合全体のなす集合 $\mathcal{P}(X)$ は $\sigma$ 加法族であり, $X$ の冪集合という.

いずれも同じ集合 $S$ の上に異なる $\sigma$ 加法族が考えられました. 同じ集合の上の $\sigma$ 加法族の間には「集合としての包含関係」から自然に誘導される包含関係が入ります. 自明な $\sigma$ 加法族は一番「小さい」し, 冪集合は一番「大きい」です.

演習2.6

$\mathcal{M}_0$ は $S$ 上の任意の $\sigma$ 加法族の部分 $\sigma$ 加法族であり, また $S$ 上の任意の $\sigma$ 加法族は $\mathcal{P}(S)$ の部分 $\sigma$ 加法族である.

さて, $\sigma$ 加法族が少なくとも2個あることはわかりました. 作ろうと思えば作れますが, 数学では「今持ってるものから新しいものを作り出す」という操作も重要視します. そこで次の定理を示しましょう.

定理2.7

$S$ の任意の部分集合族 $\mathcal{M}$ に対し, $\mathcal{M}$ を含む最小の $\sigma$ 加法族が存在する.

これは抽象度がかなり高い命題ですが, 実は大丈夫です.

証明. $\mathcal{M}$ を含む $\sigma$ 加法族は少なくとも1つは存在している*1. したがって, $\mathcal{M}$ を含むような $\sigma$ 加法族 $\mathcal{M}'$ すべての共通部分 $\bigcap\,\mathcal{M}'$ が取れ, $\mathcal{F}$ とおく. $\mathcal{F}$ は $\sigma$ 加法族で, $\mathcal{M}$ を含んでいて, 共通部分を取っていたので最小である. $\blacksquare$

最後の一行は定義通り確かめればよいですね. 自明でないと思えたら, もう一度定義を見てみましょう. また, $\mathcal{F}$ を $\mathcal{M}$ で生成される $\sigma$ 加法族といい, $\sigma[\mathcal{M}]$ で表します.


復習すべきこと

  • (集合)
  • 無限大
  • (高々) 可算
  • $\sigma$ 加法族
  • 可測空間

演習

H6 お茶大 8

$\Omega$ を任意の集合とし, $\Omega$ の部分集合の族で $\sigma$ 加法族になっているものを $A$, $B$ とする. このとき次に答えよ.

1. $A\cap B$ はまた $\sigma$ 加法族になることを示せ.

2. $A\cup B$ は必ずしも $\sigma$ 加法族にならないことを反例をもって示せ.

(ヒント: $\Omega=\lbrace 1,2,3,4,5\rbrace$ として考えてみよ.)

*1:たとえばべき集合がそうです.