kivantium活動日記

プログラムを使っていろいろやります

「Caffeをはじめよう――深層学習による画像解析の実践」の紹介

8/21にO'REILLYからO'Reilly Japan - Caffeをはじめようが発売されました。
著者はヤフーのバックエンド開発に携わっているエンジニアの石橋崇司さんで電子書籍版のみのようです。
価格が1620円とお手頃だったので早速買って読みました。

構成

構成は

  • 第1章 深層学習
  • 第2章 Caffeの紹介
  • 第3章 Caffeを使ってみよう
  • 第4章 畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)
  • 第5章 Caffeの独自要素
  • 第6章 もっとCaffeを使ってみよう
  • 第7章 モデルの学習における技術
  • 付録A Caffeの開発に貢献する
  • 付録B Datasets

となっています。

  • 第1章はILSVRC2012でHintonのチームが優勝したなどの一般的な深層学習についての紹介でした。
  • 第2章はCaffeのフォルダ構成やインストール方法を紹介しています。
  • 第3章はchars74kというデータセットを使って文字を認識するタスクの実例を示しています。
  • 第4章では畳み込み層やプーリングなどのCNNの理論的内容について軽く触れられています。(数式は出てくるもののこれだけで実装するのは少し厳しそうというレベル)また、LeNetやAlexNetについても紹介されています。
  • 第5章ではBlobやLayer、NetなどのCaffe独自のデータ構造が紹介されています。
  • 第6章ではFine-tuning、隠れ層の可視化、Feature extraction、R-CNN(物体検出から分類までを行う手法)、モデルパラメータの編集、Fully Convolutional Network(ピクセル単位で予測をするための手法)のトピックが取り上げられて、ソースコード付きで手法が解説されています。
  • 第7章ではミニバッチ学習、Data Augmentation、Dropoutの紹介です。
  • 付録AはCaffeの開発ルールの紹介、付録Bは各種データセットの紹介です。

感想

Caffeのドキュメントはいろいろなところに散らばっていて探しにくいので書籍というまとまった形で手に入るのはありがたいです。
取り上げられている内容のほとんどはWeb上の文献を集めれば再現できるものではありますが、1620円という価格を考えればCaffeを扱おうと思った人は是非持っておいたほうがいいでしょう。特に第6章はかなり有用だと思います。

僕はepub版をiPadで読んだのですが、ソースコードが読みにくく文字詰めがひどいところが多々ありました。これはepubビューワの問題なのでどうしようもないのですがこれを見ながらプログラムを書くのは少しきついかなという印象です。PDF版があれば少しはマシなのかもしれませんが、提供されていないようです。

深層学習についての書籍がどんどん発売されるのでこれからも書籍情報に気を配ろうと思います。

深層学習の書籍情報

いくつか新刊情報をまとめてみました。

データサイエンティスト養成読本 機械学習入門編

chainer作者のbeam2dさんなども寄稿されるそうので期待できそうです。

データサイエンティスト養成読本 機械学習入門編 (Software Design plus)

データサイエンティスト養成読本 機械学習入門編 (Software Design plus)

深層学習

深層学習 (機械学習プロフェッショナルシリーズ)

深層学習 (機械学習プロフェッショナルシリーズ)

既刊です。持っている人をよく見かけます。

個人的には「深層学習」という訳は「深いのはネットワークであって層は厚いものだよね」「真相学習に聞こえる」などの理由で好きではないのですが、この訳語で固まってきているようです。僕は今後しばらくDeep Learningという語を使いつづける予定です。