コンテンツにスキップ

確率と統計I/II

この授業では、推測統計学の基礎である確率収束や分布収束、最尤推定法、区間推定を扱います。確率分布などについては基本的な知識は持っている前提で話を進めますが、前提知識として必要なものをPDFでまとめたものを配布する予定です。

成績評価

授業の成績評価は各教員が25点満点で評価し、それを総合して成績評定が決定します。私の担当分では、最終回に実施する試験で成績を決定する予定です。

何を学んで欲しいか

母集団の性質をすべての標本を調査することなく、一部の標本のみを母集団からサンプリングすることで母集団の性質を推定するのが推測統計学です。この知りたい母集団の性質というのが、母集団分布に関する情報です。母集団分布について、全く情報がないなかで母集団分布の平均や分散を推定するというのは難しいものですが、母集団分布が事前にどのような分布に従うのかという形状について情報が得られている場合があります。例えば、母集団分布は正規分布の形であることはわかっているんだけど、母集団分布の正規分布の形を決めるパラメータである平均や分散がわからないという状況です。この授業では、分布の形状はわかるけど、パラメータがわからないような問題を考えて推測統計の基礎を学びます。

母集団の分布がわかっている(既知)のもとで、パラメータを推定するための代表的な方法が最尤推定法(Maximum Likelihood Estimation)です。この授業の目標の1つは、最尤推定法について理解し、実際に最尤推定量と呼ばれる分布がわかっているもとで、データへの最も当てはまりの良い分布のパラメータを推定する方法を計算できるようになることです。

もう1つの重要な概念は、得られているデータから母集団の性質を推定するということは、すべての標本を調査するわけではないので、母集団の本当の分散を「推測している」に過ぎず、本当の値と推定した値は誤差があります。推測統計学で重要なのは、この誤差の大きさがどの程度なのかを見積もることです。

このとき、まず最初に確認したいのは、一部の標本から推定しているといった「一部」の数をどんどん増やす、つまり調査する標本を大きくすると推定した値はきちんと本当の値に収束するかということです。この性質を一致性といいます。これは、知りたい母集団の情報に対して、正しい推定法を選択できているか?ということと関係します。

また、誤差を見積もるといっても、パラメータの値のばらつき方がどのようになるのかということも知らないといけません。この授業で扱う最尤推定法によって得られるパラメータの推定値は、ばらつき方が正規分布になることが知られています。この性質を漸近正規性といいます。正規分布の形状にばらつくのであれば、ばらつき方は左右対称で、パラメータの本当の値はこの辺りにあるということが主張しやすくなります。また、正規分布であればばらつきは分散を推定すればよく、計算も容易です。

この授業で学んで欲しいことの2つ目は統計的な推定におけるパラメータ推定の誤差の大きさの見積り方を学び計算できるようになることです。