機械学習に入門しようと思い、重い腰をあげて実践的な入門書として評判が良さそうだった「Python機械学習プログラミング」を読みました。
この本を読んでやっと機械学習分野の全体像がうっすら見えてきて、やっと入り口に立てたなと思います。読んで本当に良かった。 機械学習初心者の人が買うか迷っていたらオススメしたい。
Python機械学習プログラミング 達人データサイエンティストによる理論と実践 impress top gearシリーズ
- 作者: Sebastian Raschka,株式会社クイープ,福島真太朗
- 出版社/メーカー: インプレス
- 発売日: 2016/06/30
- メディア: Kindle版
- この商品を含むブログ (4件) を見る
この記事を書いた人のレベル
読書の進め方
読書会にした
一人で読み進めると絶対途中で飽きるだろうなと思ったので、興味のありそうな友人を2人巻き込んで、読書会形式で進めることにしました。
- 1~2週間ごとに1章ずつみんな読んでくる
- みんなで集まって(今回は全員住んでる場所がバラバラだったのでSkypeで)読んだ章で分かりにくかったことなどを話し合う
- 特に発表資料とかは作ってない、ゆるゆる読書会
- 勉強会としての体はあまり成してなかったけど、ペースメーカーとして大いに役に立った
読書プラン
翻訳の福島さんがこの本の読み進め方ガイドを書いてくれているのですが、基本的には特訓コース(全部読むコース)でやりつつ、読書会参加メンバーの興味や知識を鑑みて8章と9章(機械学習の応用)と13章(Theano/Kerasの使い方)は興味があったら読んでくるという感じで進めました。 thinkit.co.jp
Theanoは開発中止になっちゃったけど、Python Machine Learning, Second Edition ではTheanoの代わりにTensorFlowを使ったチュートリアルになったり、RNNやCNNについて取り上げた章が追加されているようですね。
どのくらい読み込んだか
- Pythonでのプログラミング
- 機械学習理論
- この本、あくまでPython機械学習プログラミングの本というのもあってか、数学部分は平易に書かれていたので、理論部分は副読書を読んで補強していた
- 訳注に書かれている数式の解説は分かりやすかった。
- 副読書には以下の本などを読んでいた
- はじめてのパターン認識
- これなら分かる最適化数学―基礎原理から計算手法まで (の主に1,2章)
- 副読書を読みつつ数式を追っていると一章読むのに一週間くらいかかったりしてボリュームあった...
Pros/Cons
良かったところ
あまり良くなかったところ
- 数式が平易に解説されていて(逆に)少しわかりにくかった。
- 大学初等レベルの数学が分かっていなくても雰囲気が分かるように平易に書いてくれている(どうしても難しくなるところは潔く省略されてた)のだけれど、個人的には煙に巻かれたような気持ちになった
- とはいえ他の本を参照すれば全然OK
まとめ
機械学習初心者にとっては本当に良い本でした。機械学習やってみたいけど何すればいいのかよくわからない/理論よりの機械学習入門書読んだけど何すれば良いのか分からんという人には絶対オススメしたい。
今後はこの本の範囲外の機械学習(理論)について勉強しつつ、kaggleや適当なデータセットを使って手を動かしていきたいと思う。