統計検定2級の問題は面白い。統計学は役に立つから、というだけではもったいない。
2018年6月の問7は、腕相撲で強い相手と弱い相手と交互に3回勝負し2連勝するには最初にどちらと戦う方が良いかという問題であった。直感的には先に弱い相手との勝負を選びがちだが、計算すると逆になる。どちらにも勝たなければならないのなら、勝ちづらい相手と先に勝負した方が良いというのが冷静な判断なのだ。
2017年6月の問6では、2つのコインA、Bの重さを天秤で計測するのだが、コインの重さの和A+Bと差A-Bを計測して、AとBの重さを算出するのである。なぜわざわざそんな面倒くさいことをするのか疑問に思いながら計算すると、誤差の分散がσ2/2になり個々に計測するよりも小さくなることが分かってくる。機械による測定誤差を少しでも小さくする工夫が、問題を解くうちに分かるようになっている。
また2017年11月の問2は、いくつかの説明変数から桜の開花日を予想するための回帰モデルを作成する問題だ。平均気温が最も大事であり、降水量や日照時間とはあまり相関がないことを散布図が示している。無機質な数値処理をするだけで問題自体は解けるが、普段触れない面白いデータを出題してくれて、解答者を飽きさせない。
どの業界でもデータ重視になっている昨今、教養や仕事のために統計検定を勉強する人が多いと思う。しかし問題を解いていると時々、出題者の工夫に気付き、ニヤリとほくそ笑むことがある。……やがてニヤリとするために勉強をするようになるのである。