ゼロから作るDeepLearning本をやる(7)
7章終わり。
サンプルソースでバグ見つけたのでGitHubでPullRequestを初めてやった。
GitHubわけわかんねえと思ったけど、とにかく参考サイト通りに機械的にやった。
blog.mogmet.com
章はCNNについて。結構気合い入れて読んだけど、表面上しか理解できてない気がする。
せめて理解できたところを箇条書きしておく。
- 3次元の入力データの構造を活かしたニューラルネットワーク
- 前章で使っていたアフィン変換の代わりにConvolutionを行う
- ただし、ネットワーク全体ではアフィン変換も使う部分もある
- ロバスト性のためにPoolingを行う
- Convolutionの実装には、2次元展開を行うと効率的
- (メモ)おそらくこの効率的な実装方法はpython(numpy)の威力が発揮されてる所だと思われる
- 参考ソフトの基本構造は前章と変わらず
- つまり、ミニバッチ、誤差逆伝播法、Adamといった要素を活用している
- ネットワークの構造はいろいろな形が考えられる
- AlexNetというやつがDeepLearningの火付け役となった構造
ConvolutionとPoolingのbackward処理を書きなさいと言われても今は無理だ・・・。
うう、早くも復習いりそう。
サンプルソースの実行結果は99.08%の認識率。これでも十分すごいな。
ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
- 作者: 斎藤康毅
- 出版社/メーカー: オライリージャパン
- 発売日: 2016/09/24
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (4件) を見る