最尤法と代表値
平均値や中央値は最尤推定量として見立てることが可能です。
1 最尤推定法について
最尤法について渡辺澄夫先生の『データ学習アルゴリズム』では以下のように定義されています。
データ がモデル から得られる確率密度は
です。
そしてこの値をモデルの尤度と定義します。
最尤推定とはこの尤度を最大化するパラメータを選ぶ推測法です。
尤度関数はそのモデルから標本(サンプル)が得られる確率を表していますが、これは「データから見たモデルの好み」を表していると解釈するといいでしょう。
2 平均値
データXの母数が以下の確率モデルに従うことを仮定します。
であり、は平均0で分散の正規分布に従う
今、観測値がと独立に得られたとします。この時の最尤推定量を求めてみましょう。
に従っています。
この時対数尤度函数は
です。この関数をθに関して微分すると、
となります。これが0になるときは対数尤度関数が最大になるときです。
実際、対数尤度関数=0とすると
となります。よってこれを最大化するはサンプルの平均に一致することが分かります。
これよりサンプルの平均を求めるという統計学で最初に習うことは、正規分布モデルの最尤法そのものになっていたということです。
3 中央値
正規分布モデルをLaplace分布モデルに置き換えれば中央値の最尤法での解釈も得られます。2と同様にやってみます。
データXの母数が以下の確率モデルに従うことを仮定します。
であり、は平均0のラプラス分布に従う
今、観測値がと独立に得られたとします。この時の最尤推定量を求めてみましょう。
に従っています。
この時対数尤度函数は
です。この関数をで微分し、=0とするとは中央値となります。
このように、平均や分散や中央値を求める記述統計の易しい話であっても、その背後には、パラメーター付きの確率分布によるモデル化という考え方が隠れているわけです。