機械学習の型稽古

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎今週はあまり読書時間が取れなかったので、とりあえず通読完了直前のものを取り上げておこう。基本的な教科書だけれど、数ヶ月前からコードを実際に打ち込みつつ読んできたのが、アンドレアス・ミュラー&サラ・グイド『Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎』(中田秀基訳、オライリージャパン、2017)。Pythonの機械学習用ライブラリの代表格であるscikit-learnの具体的な紹介本だけれど、機械学習を実践する上でのいろいろなやり方、tipsが学べる。もちろんこれを通読したからといって、すぐに実践に活用できるわけではなさそうだが、scikit-learnには学習用の適切なデータセットなどが含まれていて、いわば柔道などの型稽古としては悪くないのでは、という気がしている。ただ難点は、2017年刊行なのに、掲載コードを実際に打ち込んで実行すると、Future Warningが結構出るということ。一部の機能が今後のバージョンで廃用になりますよ、こちらに乗り換えてください、というわけで、わずか2年くらいで古くなってしまってしまうという、昨今のプログラミング本の命運……。機械学習では自前データの収集と前処理が重要だということも改めてわかる。そのための技法などを別口で学ぶ必要もありそうだ。