大学での専門は物理で統計を深く学ぶ機会はなかったのですが、会社での業務や趣味で機械学習を勉強し始めると統計学の必要性を強く感じるようになり、統計検定の受験に至りました。
まず一級の試験日の半年前から、東大出版の「自然科学の統計学」で基礎固めをし、検定公式の教科書である「統計学」で知識を拡げました。次に、仕事の合間を縫って公式の過去問集や、アクチュアリー資格の過去問を解き、試験問題に慣れるよう努めました。また、試験の一ヶ月前から、問題を自作して解くことで応用力を身につけるよう努めました。もともと予備校で大学入試問題の作成をしていたこともあって、とても楽しむことができました。
結果として、18年の春に準一級、冬に一級(統計数理及び統計応用理工学)に合格することができました。統計応用はS評価を頂いたものの、統計数理は計算ミスが響いて賞を得ることはできませんでした。逆にそのお陰もあって、もっと深く統計学を学びたいと思うようになり、日々勉強に明け暮れています。
さて、近年人気を博している機械学習の一つに深層学習があります。この手法は物理や脳科学のモデルから生まれ、今では情報科学の花形となりました。しかし強力な手法でありながら、あまりにも複雑なため「よくわからない」まま使われているのが現状です。私は、「よくわかる」には統計的性質の探求が必要だと考えています。例えば、線形回帰においてモデルがデータにフィッティングしているかどうかは、決定係数を見れば分かります。ベイズ最適化において回帰の予測分散を見れば、実験計画をたてることができます。深層学習においてこれらの統計的性質が分かれば、モデル自体の理解だけでなく、様々な応用が可能になります。
統計検定という資格が、こういった最先端の手法を発展させる研究者たちの登竜門になることを願っています。