はじめに
2021年8月に統計検定準1級CBT試験に合格しました。
合格に至るまでの経緯や、PBT試験、CBT試験の両方を受けた感想を記載したいと思います。
受験を検討されている方の参考になれば幸いです。
結論(※個人的感想)
いきなりですが、合格に向けての結論を述べます。
- 学習に関して
- 統計検定2級で8割程取れる理解があれば、下記勉強法で合格ラインに到達可能
- 統計学実践ワークブックと過去問(2021年PBT試験含む)に習熟+αで合格ラインに到達可能
- 難易度に関して
2016年~2019年のPBT試験 < CBT試験 < 2021年のPBT試験
CBT試験は2021年PBTに比べて計算量は少なめなので、易化していると感じる。
しかし、2019年以前のPBTに比べると数理寄りの問題が増えておりやや難しい印象。
- CBT試験受験のコツ
- 瞬間的に解法が浮かばない問題はどんどん飛ばして、後で戻ってくる
- メモ用紙がラミネートだけど驚かない(笑)
- 電卓の使い方に習熟する(メモリ機能を使えるようにしておく)
受験した理由
- 業務で機械学習、統計解析を行っており、幅広く基礎的な理解を身に付けたかった
- 最新の技術にキャッチアップする際に理解の下地となる知識を身に付けたかった
- AutoMLなどデータサイエンス系のツールがかなりコモディティ化しているので、
これからはHow toではなくKnow whyを身に付けないとまずいと思った。
そのために、統計検定準1級の勉強は役立つと思った。 - 上記を達成するために学習の指標が欲しかった
バックグラウンド
- 理系大学院卒業、材料工学専攻だったので統計学はほとんどやっていない
- メーカーでプロセスデータの解析とAI実装を担当
(30代ですが、途中でキャリアチェンジしたのでデータサイエンティスト歴は2年ほど)
受験結果
統計検定の受験結果を晒します。PBT試験に1回、CBT試験に1回落ちています。
ついでに統計検定2級の結果も記載します。
- 統計検定2級CBT試験 2019年10月合格 😄
- 統計検定準1級PBT試験 2021年6月不合格 😂
- 統計検定準1級CBT試験 2021年8月不合格 😂
- 統計検定準1級CBT試験 2021年8月合格 😄
ちなみに、
私が受けた2回の準1級CBT試験はいずれも「202107版」ですが、全く違う問題が出ました。
どのような勉強法で対策し、2回の不合格の後どう対策したか次の項で説明します。
学習方法
特別なこともしていないので、、
- 勉強期間
約4か月間(平日1.5時間、休日4時間 合計250時間ほど) - 環境作り
一人だとダレるので、データサイエンスを勉強している同志と週1で勉強会を開催しました。
データラーニングギルドというデータ分析者やデータサイエンスを学んでいる人が集まるオンラインサロンのメンバーと行いました。過去問とワークブックを各自解いてきて、不明点を解説し合う方法で行っていました。以下の点で効果がありました。- 難しいと感じるポイントは人それぞれ違うことがある。つまり、自分が悩んでいるポイントを人に聞くことですんなり解決することがある。
- 毎週コンスタントに勉強時間を確保する必要があるので、学習計画から遅れにくい
- 人に説明することで、自分の理解が深まる or 理解不足が浮き彫りになる
- 教材
ほぼワークブックと過去問しかやっていません。
(ワークブックには結構、誤植があるので注意が必要です。)
2021年6月のPBT試験終了後、Twitterで「ワークブックに過学習することの危険性」が話題に上がりましたが、半分当たっていて半分は間違っていると感じています。
正確には「ワークブックの例題、演習問題に過学習することが危険」だと思います。教材 学習量 備考 統計検定準1級対応 統計学実践ワークブック 4周 バイブルです。
CBT試験で近しい問題が出ています。統計検定 1級・準1級 公式問題集 2016年~2017年 3周 ワークブックを1周した後に解き始めました。 統計検定 1級・準1級 公式問題集 2018年~2019年 3周 2021年6月のPBT試験問題 3周 独自に解答を作成して勉強しました。CBT試験で近しい問題が出ています。 2021年8月のCBT試験問題 2周 1回目のCBT試験の問題を記憶を頼りに書き起こして、対策しました。 現代数理統計学の基礎 0周 ワークブックの不明点を調べる際に使用 多変量解析法入門 0周 多変量解析パート(重回帰、主成分分析、因子分析 etc.)の強化に使用 学習の仕方としては、
1.ワークブックを写経して考え方を理解 ⇒
2.分からない箇所を他のソースで調べる ⇒
3.ワークブックに書き込む or ノートにまとめる ⇒
4.演習問題を解く
という流れで行っていました。余談ですが、写経や計算のメモはダンボールにためていました。嵩が増してくると満足感があります(笑)
CBT試験受験時の心得
CBT試験のポイントになると感じたことを書きます。
2級のCBT試験を受けられた方は既にご存知かもしれません、、
- 時間が足りないので、迷ったら「後で見直すボタン」を押して次に進む
試験のセオリーですが、まず、解ける問題を確実に取りに行きます。CBT試験には便利なボタンがあるので、これを押して次の問題に進みましょう。
解ける問題を全て解き終えた後に気持ちに余裕を持って取り組むと意外と簡単だったりします。
- 計算用紙がラミネートされていて、書きにくいけど慌てない
全てのテストセンターの計算用紙がラミネートされているか分かりませんが、
私が受けた2箇所のテストセンターでは以下が用意されました。テストセンターで用意される物
✅ ラミネートされたメモ用紙2枚(足りなくなったら追加で貰えた)
✅ 水性ペン
(フタを開けっ放しにすると乾燥するので、いちいちフタするのが面倒、、)
✅ 数値表
✅ ヘッドフォン
(席ごとに備え付け、他の試験実施者でキーボード入力がうるさい方がいたので使用した😅)
マルチンゲールラミネート用紙は書きにくいですが、試験に影響を及ぼすほどではありませんでした。
水性ペンが、カスレていることがあるので試験前に試し書きしましょう。
- 電卓の使い方に習熟する(メモリ機能を使えるようにしておく)
統計検定準1級のような時間が足りない試験ではなるべく効率の良い計算方法を実施したほうが良いです。電卓の計算機能で便利なのが「メモリ機能」です。
威力を発揮するが、分散分析で平方和を求める時や、適合度検定でカイ二乗統計量を求める時です。
例えば、以下のカイ二乗統計量を計算をする際に、メモリ機能を使わないと$ \frac{(x_i-n \tilde{p}_i)^2}{n \tilde{p}_i}$を計算する度に結果をメモする必要があります。
メモリ機能を使うとメモする必要が全くないので、書き間違え、見間違え、入力間違えのリスクを減らせます。(ラミネート用紙になるべくメモしたくない^_^;)$T(x)=$
$\sum_{i=1}^{I} \frac{(x_i-n \tilde{p}_i)^2}{n \tilde{p}_i}=$
$\frac{(7-9)^2}{7}+\frac{(7-3)^2}{7}+\frac{(7-5)^2}{7}+\frac{(7-2)^2}{7}+・・・$
マルチンゲールたかが電卓、されど電卓。
受験のメリット・デメリット
最後に、受験したことによるメリットとデメリットを述べたいと思います。
メリット
- データサイエンティストとして働く上で業務遂行に(少し)自信を持てるようになった
準1級では統計学と機械学習の最低限の範囲をカバーしているので、scikit-learnなどのツールを使って解析する際にも「基本原理は抑えている」という自信を持てるようになりました。また、周囲を見渡しても、「scikit-learnは使えるけど、手計算はやったことがない」という人が多いので、妙な自信になります(笑)。さらに、統計検定2級よりも実用的だと思いました。たとえば、実務で回帰分析を行う場合、回帰モデルの評価が必要になります。
統計検定2級では、回帰分析の方法、解釈の仕方は触れられていますが、モデル自体が正しいのか?といった観点は問われません。
統計検定準1級ではそのようなノウハウもカバーされています。マルチンゲール手計算で式を追う経験をしていると、「PCAてブラックボックスだよね~。」なんて発言に突っ込みを入れることができます。
- 最新の技術にキャッチアップし易くなった
職務がらAI研究者と議論することが多いのですが、arXivに掲載されるような最新のアルゴリズムであっても内部でベイズの定理や尤度計算など、統計検定準1級に出てくる概念で理解できるものが多くあります。なので、統計検定準1級の学習を通じて議論や論文読みに必要な基礎体力が向上したと感じています。
- 現実世界の複雑さを再認識できた
逆説的ですが、統計検定準1級の限界も感じています。
と言いますのは、ワークブックや過去問で仮定されているような前提や、綺麗な分析結果を導ける課題が現実世界では少ないということです。
たとえば、時系列解析のパートではほぼ100%「弱定常過程」が前提となっていますが、私が解析している組み立て産業のプロセスデータだと、そのような前提を仮せることはまずありません😅(あるとすれば、プロセス産業における大規模プラントの連続運転データくらいか、、)
実務で誤った分析をしないという点では、各手法についてどのような前提条件が課されているかを知ることこそ、価値があるかもしれません。
デメリット
- 一旦勉強を始めると、合格するまで止められず、他のスキルアップが疎かになった
CBT試験が開始され、いつでも試験が受けられるようになりました。
学習して知識を蓄えることが目的ですが、やはりそこは人間、、勉強したからには合格したいです😅
一旦、学習を中断してしまうと、記憶が薄れるため、継続して勉強、試験を受け続けることが合格への最短コースと思います。
その期間は他のスキルアップに時間が割きにくい状況になります。
- 何度も落ちると、取り敢えず合格すれば良いという考えになってくる
私は2回試験に落ちたので、3回目はどうしても受かりたいと思っていました。
試験勉強から解放されたいという思いも強かったです。
そうなると、、試験問題に過学習したような取り組みになってきます。精神的にあまり良くない状態かと思っています。
(これが、統計学理解のベクトルと大きく外れているとも思わないが、、)
費用としても交通費を入れるとトータル3万円弱費やしたので、結構痛かったです。