いきなり統計検定1級に一発合格した時の話(参考書・勉強法など)
統計検定に合格した話
今回は過去(2017年)に統計検定に合格した時の勉強法などについて書こうと思います。 統計検定1級は、満点こそ難しいものの合格ラインへ到達するのは比較的簡単なタイプの試験だと思いますので、 「とにかく合格したい」という方は特に参考にしていただければと思います。
最近では就活生だけでなく、コンサルタントやエンジニア、公務員などの職種の方も多く受験されているとのことなので、 活躍の場を広げたり、統計マターに自信を持って当たれるようになるには統計学の勉強は大事と考えている人も多いのではないでしょうか?
受験時のスペック
- 理系大学院生(修士)
- 統計は専門でない
- 統計検定準1級,2級など受験経験なし
とこんな感じで、授業も一応は受けたことはあるけど、真面目に統計の勉強はしていませんでした。 正規分布が何かはなんとなく知っていて、t検定とかは聞いたことはあるけど、正直わからないなぁというレベルでした。 おそらく統計検定2級は通らないくらいのレベルだったと思います。
統計検定1級とは
統計検定とは
統計に関する知識や能力を評価する試験です。
「統計検定」とは、統計に関する知識や活用力を評価する全国統一試験です。 データに基づいて客観的に判断し、科学的に問題を解決する能力は、仕事や研究をするための21世紀型スキルとして国際社会で広く認められています。
統計検定1級のレベル
HPにある通り、統計検定1級は大学3,4年で学習するレベルの統計学の知識が問われます。 最近はツールが発達しているため、自分で手を動かさなくても自動的にフィッティングしてくれるツールも多く存在しますが、 それらが一体どのくらい信用できるかなどは理論を学ばない限りわかることはありません。 そういった意味でも、統計検定で提供されているレベルの理論的な知識を知っておくことは非常に有用だと思っています。
大学専門課程(3・4年次)で習得すべきことについて、専門分野ごとに検定を行います。
勉強方法
勉強法
大体半年くらいかけて勉強しました。最初はだらだらゆっくり勉強していき、最後の方に畳み掛けるようにスパートをかけるスタイルです笑
- 基礎固め〜応用・発展〜過去問
という定番のスタイルでしたが、
- 基礎固め〜過去問ちょっとかじる〜応用・発展〜過去問
のように過去問を事前に見ておくともっと上手くいったと思います。
参考書
利用した参考書をまとめていきます。大体重要な順番に書いて行こうと思います。
統計学入門(通称: 赤本)
- オススメ度: ★★★★☆
- 時期: 基礎固め(半年前くらい)
何も知らないところから始められます。定番なので持っていて損もないと思います。 この本は何回も読みました。この本が一通り読めたら過去問を少し覗いておくと良いと思います。 統計検定2級・準1級受験の人にもお勧めできると思います。
自然科学の統計学(通称: 青本)
- オススメ度: ★★★☆☆
- 時期: 応用・発展
- コメント: 赤本でやった内容の発展・一般化といった内容が多いです。 統計検定1級のレベルをやり切るには緑本だけでは不足ですので、青本まで読む必要があります。
日本統計学会公式認定 統計検定1級対応「統計学」
- オススメ度: ★★★★☆
- 時期: 応用・発展
Amazon レビューでは評価が低いですが、やはり検定の内容を網羅しているということで安心感があります。 それぞれの内容を細かく噛み砕く余地はこの本にはないので、適宜、1.,2.の赤本・青本の内容を見返したり、ブログや記事などのネットの情報で補っていました。
日本統計学会公式認定 統計検定1級対応「統計学」
- オススメ度: ★★★★☆
- 時期: 応用・発展
Amazon レビューでは評価が低いですが、やはり検定の内容を網羅しているということで安心感があります。 それぞれの内容を細かく噛み砕く余地はこの本にはないので、適宜、1.,2.の内容を見返したり、ブログや記事などのネットの情報で補っていました。
明解演習 数理統計
- オススメ度: ★★★★☆
- 時期: 基礎固め
この本は当時利用したわけではありません 演習がどうしても足りなくなるのでこのタイプの本で演習できると非常に学習効率が上がっただろうなぁと思います。 今になって別の試験対策でこちらの本を見つけて良さそうだったのでこちらに入れさせていただきました。
応用をめざす数理統計学
- オススメ度: ★★☆☆☆
時期: 発展・応用?
自然科学の統計学 が難しくて、困ったときに購入しましたが、あまり利用できませんでした。 内容的にも統計検定にも合っていないと思うので、基本は赤本・青本で乗り切るのが良いかなと思います。 最近はネットの記事も充実しているので、あとはネットの情報で補っていけば十分戦えると思います。
問題の分析(統計数理)
統計数理は5問から3問を選択します。 この選択できる点を活かすことで合格の可能性がアップするので問題の分析を適切に行い、「どの問題を選ぶか」を準備したいですね。
問題1
計算するだけ問題(比較的簡単)
計算するだけの問題が多いです。この問題は選択するのにオススメです。
というのも、基本的な計算方法さえマスターしてしまえば解ける問題がほとんどだからです。 逆にいうと、この問題に歯が立たない場合は、合格が非常に厳しいので、試金石になる問題と言えるかもしれません。
2019年の過去問でも、計算するだけの問題("分散を求めよ")になっている他、 ヒント付きの問題すらありました。
問題1は絶対に死守するべし&点数のとりどころ ということになります。 ここを満点とることで合格ラインの半分くらいはとれることになります。
問題2
変数変換がよく出る
みたいな感じの変数変換系が割と多く出題されていますが、必ずというわけではないので注意してください。 2次元確率変数や検定に近いものが出たこともあります。
変数変換の流れで順序統計量が出た時もありました。 その時は誘導がありましたが、誘導なしでも簡単な導出方法を一つ覚えておくだけで得点できる問題でした。(これは宣伝)
リスクを元にヤマを張るなら変数変換に絞るのもアリだと思います。 変数変換はもともと組み合わせて出ることも多いのでマスターして損はない領域にも思えます。
問題3
推定がよく出る
推定の問題が多めに出る傾向にありますが、回帰が出たこともありました。
推定の中では最尤法が多そうですが、区間推定も出ているのであまり絞り切らない方が良さそうです。
問題4
予想不可能
いろんな問題が出ます。得意なやつが出たらラッキーくらいで構えたいですね
問題5
予想が難しくなっているが、しいていうなら検定が多め?
ここも検定が多い傾向がありましたが、2019年はベイズ推定が出るなどちょっと読みにくくなっている問題だと思います。
とはいえ、どの道勉強する必要があるので、検定が出ると思って少しだけ多めに検定は勉強しておいて良いでしょう。 問題3で検定が出ることも考えるとそこまでもったいなくもなさそうですし。
順序統計量の確率密度関数の簡単な導出
順序統計量とは
互いに独立に同一の分布に従う確率変数 を考える。これらの確率変数の実現値のうち、番目に小さい値の確率変数をを第位順序統計量と呼びます。 特にを最小順序統計量、を最大順序統計量と呼ぶこともあります。
の確率密度関数は、などの確率密度関数を[tex: f X]とし、分布関数を[tex: F X]とすると以下のように書けることが知られています。
よく紹介されている導出は難しい
順序統計量は、アクチュアリーの試験や統計検定でも過去に出題されたことがあるものの、有名な緑本や青本にはしっかりは載っていません。
確率密度関数の導出自体は、Wikipedia やこういった講義ノートにある導出は少し大変です。 詳しくはリンクを参照いただきたいのですが、分布関数 を求めてから微分する方法は計算が煩雑で追いかけるのが非常につらいです。
多くの記事ではここで、「微分することで導出できます」で終わってしまうのですが、実際にはかなり長い計算になるわけです。 この記事では、微分せずに順序統計量の確率密度関数を導出したいと思います。
シンプルで直接的な導出方法
よりシンプルに直接的に導出する方法をここにまとめておきます。
まず、確率密度関数の定義から以下が成り立ちます。
この式から(やや大雑把に)をとなる確率と捉えると、つまり、以下も同時に成り立ちます。
ここで、やはそれぞれ区別する必要がなく、 の中から以下のものを個、より大きいものを個選ぶことができれば十分であることに注意します。
すると、この確率は の中から以下のものを個、より大きいものを個、と等しいものを1個をから選び出す確率といえます。 が 以下の確率は、であり、より大きい確率はであり、と等しい確率はです。 また、から選び出す場合の数は であることより、
と導けます。統計検定でもこれがわかれば速攻で解ける問題が混ざっていることもあったので、暗算で導出できるようにしておくと試験対策としても良いかもしれませんね。
マンネリの語源について
マンネリって何語?
「リモートワークは仕事がマンネリ化しやすい」
「家に居過ぎてマンネリ化してきた」
などで使われる"マンネリ"という言葉ですが、これの語源ってなんでしょう?
答え
英語のマンネリズム(mannerism)から来ています
英語では、文学や芸術に対してのワンパターン化に関しても指して使う言葉のようです。
おまけ(という名のメインコンテンツ)
マンネリズム(mannerism) の由来は?
マナー(manner)から来ています。
「えっ」という方も多いかもしれませんが、英語のmannerは日本語のマナーの意味合いより、「手段・方法・やり方」の意味で使われることが多い言葉です。
受験勉強で "in manner of ~" (~のやり方で)というイディオムも覚えた人もいるかもしれませんが、そのmannerです。
このmanner(やり方)から"同じやり方に陥っている状態"をmannerismと呼ぶようになったと考えられますよね。
今度から「マンネリ」と聞いた時には、「(お、マンネリはmannerismから来ている言葉で、mannerism は manner から来ている。そして、manner は日本語のマナーとは違って、"やり方・手段"の意味だ。だからこそ、mannerismが"同じやり方を繰り返す状態"を指すようになったんだ。)」と心の中で思い出すとちょっと幸せな気持ちになるかもしれませんね。
マンネリズム(mannerism) を深掘りする
英語のマンネリズム自体に"マンネリ化"の意味もあるようなので、最近使われちる"マンネリ化"と言う言葉は、同語反復("馬から落馬"みたいな言葉の意味の重複)になっているかもしれませんね。
負の二項係数が重複組み合わせになることの簡単な理解
負の二項係数に現れる -1 がしっくりこない...
負の二項係数は、二項係数を拡張して以下のように表されるものです。
ちなみに通常の二項係数はこんな感じです。
しっくりこないこと
- の がどこからくるのかわからない
- は であるがなぜ重複組み合わせになるかがわからない
- と同じような直観的な解釈がしたい!
は との比較からしてしっくりきます。 しかし、通常の二項係数に書き直したときにでてくる の がしっくりきません。
なぜ一つずれるようになるのでしょうか?
一言で言うと...(忙しい人のための結論)
(2)より、 の係数を考えると、個の各項から重複を許しての冪乗の項を選ぶと解釈できます。 このように考えると、の係数はになることがわかり、(1)の解釈を通常の二項係数の場合と同様に考えることができます。
これを以下では詳しくみていきます。
まずは計算してみる
まずは定義に基づいて計算を進めてみようと思います。 負の二項係数の証明というよりは、式変形を追いかける形になります。
1. まずは普通の二項係数みたいに展開してみる
納得のいく という表現から書き直していきます。
2. マイナスをくくり出す
分子を次のようにしてマイナスをくくり出します。 ここで、分子の掛け算の項の数が個あることに注意すると次のようになります。
あ、なんか出てきましたね。
から 個順番に整数を選択するとその最後が になってその負をとると になるわけですね。
3. 通常の二項係数に置き換える
1, 2 の計算から負の二項係数を通常の二項係数に置き換えてみます。
よくみると重複組み合わせになっている
3 の最後の計算を見るとこれは重複組み合わせになっています。
ここがもしかしたら、しっくり納得がいくためのヒントになるかもしれません。
でもしっくりはこない
でもこれでもまだしっくりはきません。。。
通常の二項係数のように項の選び方の場合の数としての解釈ができないものでしょうか?
解釈してみる
上の計算での出どころは多少わかりましたが、まだしっくりはきません。 通常の二項係数での有名な解釈を復習します。
通常の二項係数のよくある解釈
まず、通常の二項係数は以下の展開で登場します。
これは次のように解釈できます。
を展開する際に、個のからそれぞれとのどちらかを選び出して多項式を構成していると考えます。 例を考えます。 の係数は、個の からを選んだものが個あると考えられます。 したがって、個のうち個のから を選び出すと考えられるので、その係数はになると解釈できるわけです。
負の二項係数の解釈
負の二項係数でも同じような解釈がしたいのですが、マイナスが入っていると解釈しにくそうなので次のような展開を考えてみます。
分数も使いにくいので、以下のような(テイラー)展開も思い出します。
をこれを用いて展開すると、
となります。 の個の積になっている点に注意してください。
この形にした上で先ほどの通常の二項係数のよくある解釈と同様の解釈をしてみます。
今度はもう少し複雑です。
同じようにの係数を考えます。今回は個あるの中から、,,,... のうちのどれか一つをそれぞれ選ぶと考えることができます。
例えば、 でのケースを考えます。
このときのの係数を考えます。
を一つの項として考え、左から項A,B,Cと名前をつけます。
項A,B,Cから,,,...から一つ選び出してを構成することを考えると、 が1つと が2つのパターンとが2つとが1つパターンが考えられます。
ここでさらに をが「二つある」と解釈すると、項A,B,Cから重複を許しての合計が二つになるように選び出すことと等しいことに気づけます。
したがって、の係数はその場合の数と一致するので、 となることがわかります。
確認のため全パターン書き出してみます。
項A | 項B | 項C |
---|---|---|
書き出すことでも の係数が になることが確かめられました。
最後によくある場合の数の問題に見えるように色のついたボールに置き換えて考えてみます。
色のついたボールの問題への変換
を 個のボールとみなします。
このように考えることで以下のような対応づけが可能です。
"個あるの中から"
→ を一つの色のついたボールの集まりとみなします。 つまり、種類のボールが存在していると読み換えます。
"の中から、,,,のうちのどれか一つをそれぞれ選ぶ"
→ そして、これはある色(例: 赤色)のついたボールの集まりを表しており、を選ぶ時にはその色(例: 赤色)のボール0個を表していると考えます。 はその色(例: 赤色)のボール1個を表し、同様にはボール2個を表しています。 各色のボールは個(以上)あると読み換えられます。
したがって、先ほどの問題は
n種類のボールがそれぞれn個(以上)ある。 この中からボールをr個取り出す時の場合の数を求めよ。
と変換できます。
答えはもちろん です。
まとめ
の展開を考えることで、通常の二項係数と同様に負の二項係数も各項からの冪乗項を取り出す場合の数としての解釈ができるようになりました。
これで負の二項係数について忘れた場合は、を展開することで思い出せるかもしれませんね。
(負の二項係数に登場する重複組合せがテイラー展開が必要になるとはなかなか面白いですね)
立体三目並べは先手必勝
一言で言うと...
立体三目並べ(立体○×ゲーム)は、先手が必ず勝ちます!
立体的で何やら難しそうな感じがしますが、実は先攻が超有利なゲームのようです。
頭脳王で有名になった(?)「立体三目並べ」とは
頭脳王 という番組でも何度か登場している「立体三目並べ」ですが、どういったものなのでしょうか。
基本的には普通の2次元の○×ゲームとあまり変わらないのですが、少し違う点もあります。
呼び方
様々な呼び方をされているようですが、主に
などと呼ばれているようです。
ルール
みなさんもよくご存知の「○×ゲーム」「3目並べ」と基本は変わりません。これまでの2次元(縦 × 横)に加えて、高さ方向を加えた3次元の中で3つ揃えれば勝ちとなるゲームです。立体三目並べでは、3 x 3 x 3 = 27個 に玉を置くことができます。どこかの面の縦・横・斜めのどれかを揃えた方が勝ちになります。
(引用: マルバツゲームが立体的になって戦術が広がった「3D ○×GAME」 - GIGAZINE)
2次元の三目並べにはない特徴としては、
- ど真ん中には置けない
- 空中には置けない
という制限があります。
ど真ん中には置けない
「ど真ん中」とは、3段の内の2段目の中央のことです。ここには、1段目の中央に玉が置かれたタイミングで、2段めの中央には、先攻のものでも後攻のものでもない中立の玉が置かれます。この中立の玉は、どちらの玉とも扱わない、いわばおじゃま虫のような存在になります。
空中には置けない
上の画像でもわかるように、下のものから詰めていく必要があります。たとえば、一番始めに一番上の段に玉を置くことができません。「重力も考慮する」という制限に言い換えられるかもしれません。
これらのルールは先攻が強くなりすぎるために必要な制限のようですね。実際にこれらを認めると先攻がより有利になります。
必勝法
最初に書いたとおり、
「このゲームには(先手に)必勝法がある」
のです。それも、先手の1手目はどこにいっても良いのです。なんていう先手ゲー。。。
みなさんご存知の通り、普通の2次元の三目並べでは、先攻も後攻も最善手を行くと引き分けになります。このことを考えると、3次元での先攻の強さが圧倒的なことが感じられます。
説明のための表記方法
説明のために9マスの中でおける場所を以下のようにナンバリングしておきます。
1 | 2 | 3 |
4 | 5 | 6 |
7 | 8 | 9 |
立体三目並べでは、この9マスが3階層になっているので、それを表すために以下のような書き方で表すことにします。
1-8 → 1段目の8番の位置
2-4 → 2段目の4番の位置
この表記方法を使うと、先程のど真ん中には置けないというルールは、2-5には置けないと書くことができます。
先手の1手目
先手の1手目として可能なパターンを考えます。
まず、空中には置けないというルールがあるため、1手目として玉を置けるのは最下層の1段目に限ります。
対称性を考えると、先攻の1手目は実質的には以下の3パターンであることがわかります。
- 角(1,3,7,9)
- 辺(2,4,6,8)
- 中央(5)
1 | 2 | 3 |
4 | 5 | 6 |
7 | 8 | 9 |
よってこの3つのパターンから始めた場合に先手が必ず勝てるかを調べれば良いことになります。
角(1,3,7,9)から始めるパターン
全パターンの列挙はできないので、後攻ができるだけ粘るパターンを以下に挙げます。ここでは、1段目の角である、1-1から始めることにします。
先攻 | 後攻 | |
---|---|---|
1ターン目 | 1-1 | 1-5 |
2ターン目 | 1-3 | 1-2 |
3ターン目 | 1-8 | 1-4 |
4ターン目 | 1-6 | 1-9 |
5ターン目 | 2-3 | 3-3 |
6ターン目 | 2-6 | 3-6 |
7ターン目 | 2-9 |
1段目 | 2段目 | 3段目 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
o | x | o | - | - | o | - | - | x | ||
x | x | o | - | # | o | - | - | x | ||
- | o | x | - | - | o | - | - | - |
上のような形で先攻が勝ちます。青色の部分が3目が並んだ部分になります。他の分岐もありますが、これが比較的長い展開になります。最後の6ターン目のダブルリーチのところが立体を活かした、高さ方向を含んだダブルリーチなので必見です。
ちなみに、角から始まるケースの必勝法のパターンに関しては、高知工科大学の学生さんの資料 でも説明されてあります。
辺(2,4,6,8)から始めるパターン
このパターンは上記の学生さんの資料にありません。そして、このパターンが先攻が負けやすいパターンです。
普通の三目並べでも、ざっくり言って、中央が強くてその次に角が強いです。
同じように勝ち筋を書いても面白くないのでクイズ形式にしてみます。ここでは、1段目の辺の1-2から始めることにします。
問題: 以下のように手が進んだとき先攻が勝つために次に行くべき手はどれでしょう?答え
先攻 | 後攻 | |
---|---|---|
1ターン目 | 1-2 | 1-5 |
2ターン目 | ??? |
1段目 | 2段目 | 3段目 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
B | o | - | - | - | - | - | - | - | ||
C | x | - | - | # | - | - | A | - | ||
- | D | - | - | - | - | - | - | - |
選択肢:
- 3-5
- 1-1
- 1-4
- 1-8
いかがでしょうか?答えは記事の一番下にあります。
中央(5)から始めるパターン
やはりこのパターンが最強です。辺のところでも書いたように2次元の三目並べ同様、中央から始めると間違いにくいと思います。
全パターンは書けないのでここでも代表的なパターンを載せます。高さ方向の斜めを活用した勝ち方なのでクールです。先ほどと同様、青色の部分が3目が並んだ部分になります。
先攻 | 後攻 | |
---|---|---|
1ターン目 | 1-5 | 1-1 |
2ターン目 | 1-3 | 1-7 |
3ターン目 | 1-4 | 1-6 |
4ターン目 | 1-8 | 1-2 |
5ターン目 | 2-3 | 3-3 |
6ターン目 | 2-2 | 2-1 |
7ターン目 | 3-1 | - |
1段目 | 2段目 | 3段目 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
x | x | o | x | o | o | o | - | - | ||
o | o | x | - | # | - | - | - | - | ||
x | o | - | - | - | - | - | - | - |
終わりに
実は3次元の方が先行有利
2次元の三目並べは、後攻はどうやっても勝つことができません。しかし、3次元の場合は高さ方向もあるので、なんとなく「後攻にもチャンスがありそう」と思いがちです。
しかし、現実は甘くありませんでした。
3次元の三目並べは後攻はノーチャンスです。それどころか後攻必敗です。
しかも、先攻の最初の1手はどこにいっても良いのです。なぜなら、先攻の1手目を角、辺、中央のどこにおいても先攻必勝だからです。
先攻の1手目は中央以外にしよう
この記事の内容からでは全てを説明しきれていないのですが、先攻の1手目を1-5の中央から始めると非常に先攻が有利です。よって、まともに勝負を楽しむなら、先攻は中央以外の角か辺から始める、というルールを追加したほうが良さそうです。
活用方法?
先攻必勝であることを知らない人に対しては、
さも追加ルールかのように上記の2つの条件をつけて、先攻が少し不利になったかのように見せて先攻を選んで勝負してください
(さらに、先手必勝は1手目に依存しないので「最初の一手目だけ指定させてあげるよ」とさらに条件をつけることができますね)
そうすることでさも対等な勝負をしているように見せながら必勝することができます!!??
これは半分冗談ですが、あまり先攻必勝だと知っている人は少ないのでこの知識はちょっと差がでそうですね。
問題の答え
先手の1手目を辺から始めた場合の「次の手」問題の答えを書きます。
答えは、Cの1-4です。それ以外だと後攻が必勝します。
正解パターン(C.1-4)
先攻 | 後攻 | |
---|---|---|
1ターン目 | 1-2 | 1-5 |
2ターン目 | 1-4 | 1-3 |
3ターン目 | 1-7 | 1-1 |
4ターン目 | 1-9 | 1-8 |
5ターン目 | 2-7 | 3-7 |
6ターン目 | 2-4 | 3-4 |
7ターン目 | 2-1 | - |
不正解パターン(B.1-1)
先攻 | 後攻 | |
---|---|---|
1ターン目 | 1-2 | 1-5 |
2ターン目 | 1-1 | 1-3 |
3ターン目 | 1-7 | 1-4 |
4ターン目 | 1-6 | 2-3 |
5ターン目 | 3-3 | 2-2 |
6ターン目 | 2-1 | 3-1 |
不正解パターン(D.1-8)
先攻 | 後攻 | |
---|---|---|
1ターン目 | 1-2 | 1-5 |
2ターン目 | 1-8 | 1-6 |
3ターン目 | 1-4 | 1-9 |
4ターン目 | 1-3 | 1-1 |