初学者が機械学習の勉強をするときに、一番参考にするのが、参考書だと思います。しかし、一方で参考書によっては、内容が堅苦しく、十分に知識がある人にとっては整理されてわかりやすいものの、初心者には理解が難しいような本も多数あります。僕自身も本を読み進める上で、理解しがたい内容の本に多数出くわしたので、本気でオススメの本と、正直初心者にはオススメできない本を紹介します。
本の良さの基準としては、初心者にとって理解しやすく表現されていながら、本質をついた内容を展開しているような本を良いとしており、分かりやすさを重視するあまり、数式の部分であったり、あるいは堅苦しい数式のオンパレードでわかりにく内容の本は評価低めで算出しています。
初心者にオススメの機械学習本
パターン認識と機械学習 上・下
どこでもよく聞く機械学習本として通称PRMLと呼ばれる、パターン認識と機械学習です。この本は大学教養課程レベルの数学書レベルで機械学習に必要な知識を解説している、大変良書です。初心者にはオススメできないという人もいるかもしれませんが、逆にこの本の内容を大体理解できるようになれば脱初心者と言えると思うので、そういう意味で初心者にはぜひ読んでもらいたい本です。当然理解できないところは山ほど登場することになるのですが、ネット検索で知識を補完しながらじっくり腰を据えて読むと良いと思います。
入門 機械学習による異常検知「Rによる実践ガイド」
こちらの本は非常に理解しやすく、オススメ度は非常に高いです。数式をある程度用いつつも、言葉による補足が充実しており、数式でも言葉によるニュアンスで理解できる本です。題材が異常検知となっていますが、内容としては回帰だったりでも使われるような汎用的な手法が多く解説されているので、全く問題ないと思います。本の著書は、2022年現在米国ワシントンのIBM研究センターに勤務されている井出剛さんです。井出さんは東京大学で博士号を取得され、機械学習の学会誌や国際会議にも多数論文を投稿されている方で、前述のPRMLの訳者の1人でもあります。本の内容は初心者〜中級者向けとある程度のレベル感ですが、抽象度が高く書かれている分内容も非常い濃く、コスパの高い一冊となっています。
正直オススメできない本
正直ここの内容は本当に書きたくないのですが、あくまでも初心者にオススメできないという理由です。紹介してしまっている本の著者の方が見られておりましたら、大変申し訳ありません。オススメできない本を紹介する以上、その理由についても自分なりに書いておりますので、参考にしていただけると幸いです。
はじめてのパターン認識
この本は学生時代に機械学習を勉強するためにます最初に僕が買った本ですが、買って本当に後悔しました。内容に関しては、数式が多用されており読み進めることができず、初心者が理解することは到底不可能だと思われます。「はじめて」の機械学習と書かれていますが、「はじめて」パターン認識を勉強する人は控えた方が良いと思います。一方で、ある程度統計学の知識がある人が勉強するために使うのであれば、非常に理にかなっており、非常にオススメだと思います。
Pythonによる異常検知
この本は異常検知のアルゴリズムをとりあえず概観しようと思った時に利用させていただきました。この本については、正直賛否が分かれるところだと思います。正直、内容としては、非常に薄いです。非常に薄い割に、分かりやすさもそうでもなく、網羅性もそこまで高くありません。どの面でも中途半端で、長い間腰を据えて読む本でもなく、正直本屋で立ち読みをするのにはちょうど良いかなと思いました。著者の方もあまり執筆に時間を使ってない、おそらく大学の講義教材の使い回しなのだろうと思いました。端的にいえば、クオリティが低かったです。しかし、近年業務で比較的使われているようなアルゴリズムに関してはある程度は紹介されているので、現状の異常検知周りのアルゴリズムを概観したい人には向いているかもしれません。
機械学習のための確率と統計
本のタイトルだけ見ると、機械学習の初心者が機械学習に必要な数学を学ぶのにちょうど良いのでは?と思うかもしれませんが、内容は結構お粗末なものになっています。本の内容自体的に機械学習の初心者を想定されているはずなのに、数式の解説はかなり簡略的なものしかなく、ある種の公式集となっています。個人的な主観もあると思いますが、デザインもあまり優れているとはいえず、誰が何のために読むことを想定されているのか、本当によくわからない一冊です。Amazonの口コミも結構ひどいものとなっていました。この本を買うなら、絶対にPRMLを買うことをオススメします。ちなみにこの本の杉山将先生はPRMLの訳者の一人です。