順序統計量の確率密度関数の簡単な導出
順序統計量とは
互いに独立に同一の分布に従う確率変数 を考える。これらの確率変数の実現値のうち、番目に小さい値の確率変数をを第位順序統計量と呼びます。 特にを最小順序統計量、を最大順序統計量と呼ぶこともあります。
の確率密度関数は、などの確率密度関数を[tex: f X]とし、分布関数を[tex: F X]とすると以下のように書けることが知られています。
よく紹介されている導出は難しい
順序統計量は、アクチュアリーの試験や統計検定でも過去に出題されたことがあるものの、有名な緑本や青本にはしっかりは載っていません。
確率密度関数の導出自体は、Wikipedia やこういった講義ノートにある導出は少し大変です。 詳しくはリンクを参照いただきたいのですが、分布関数 を求めてから微分する方法は計算が煩雑で追いかけるのが非常につらいです。
多くの記事ではここで、「微分することで導出できます」で終わってしまうのですが、実際にはかなり長い計算になるわけです。 この記事では、微分せずに順序統計量の確率密度関数を導出したいと思います。
シンプルで直接的な導出方法
よりシンプルに直接的に導出する方法をここにまとめておきます。
まず、確率密度関数の定義から以下が成り立ちます。
この式から(やや大雑把に)をとなる確率と捉えると、つまり、以下も同時に成り立ちます。
ここで、やはそれぞれ区別する必要がなく、 の中から以下のものを個、より大きいものを個選ぶことができれば十分であることに注意します。
すると、この確率は の中から以下のものを個、より大きいものを個、と等しいものを1個をから選び出す確率といえます。 が 以下の確率は、であり、より大きい確率はであり、と等しい確率はです。 また、から選び出す場合の数は であることより、
と導けます。統計検定でもこれがわかれば速攻で解ける問題が混ざっていることもあったので、暗算で導出できるようにしておくと試験対策としても良いかもしれませんね。