ウニ’s blog

勉強した結果を書いていきます

ゼロから作るDeepLearning本をやる(7)

7章終わり。
サンプルソースでバグ見つけたのでGitHubでPullRequestを初めてやった。
GitHubわけわかんねえと思ったけど、とにかく参考サイト通りに機械的にやった。
blog.mogmet.com

章はCNNについて。結構気合い入れて読んだけど、表面上しか理解できてない気がする。
せめて理解できたところを箇条書きしておく。

  • 3次元の入力データの構造を活かしたニューラルネットワーク
  • 前章で使っていたアフィン変換の代わりにConvolutionを行う
    • ただし、ネットワーク全体ではアフィン変換も使う部分もある
  • ロバスト性のためにPoolingを行う
  • Convolutionの実装には、2次元展開を行うと効率的
    • (メモ)おそらくこの効率的な実装方法はpython(numpy)の威力が発揮されてる所だと思われる
  • 参考ソフトの基本構造は前章と変わらず
    • つまり、ミニバッチ、誤差逆伝播法、Adamといった要素を活用している
  • ネットワークの構造はいろいろな形が考えられる
    • AlexNetというやつがDeepLearningの火付け役となった構造

ConvolutionとPoolingのbackward処理を書きなさいと言われても今は無理だ・・・。
うう、早くも復習いりそう。
サンプルソースの実行結果は99.08%の認識率。これでも十分すごいな。
f:id:uni8inu:20161026004738p:plain