ゼロから作るDeepLearning本をやる(8)--最終回

8章終わり。今までの知識を元に、専門用語を用いてDeepLearningとは何かを説明。
ネットワーク構造がDeepなCNNということだった。
また、2015年のコンペ結果等ごく最近までの動向が大変よくわかった。

サンプルソースでは重み層8のVGGによるMNISTの認識。最終的な精度は99.35%になった。
以下は誤認識判定となった部分。
f:id:uni8inu:20161026215623p:plain

誤認識部分は人間でも判断に困る怪しい手書き文字ばかりだ。
誤認識の正解値(label値)と画像とを見比べると、うーむ。
なんともゲシュタルト崩壊するな。数字ってなんだっけ・・・。

まとめがてら箇条書きして終える。

大規模画像認識コンペ(ILSVRC)が行われている
- 本で解説したネットワークが優秀な記録を残している
- AlexNet(2012),VGG(2014),ResNet(2015)
高速化の案には、GPUによる高速化、分散学習、半精度浮動小数点数の活用がある
DeepLearningの応用としては、物体検出、セグメンテーション、画像キャプション表示がある
- セグメンテーションには全結合層を用いないFCNを利用する
教師なし学習には、行動と報酬をペアにした強化学習という分野がある
- 強化学習の例としてDeepQ-Networkがある
- DQNは最適行動価値関数のためにCNNを利用している

本が難しくなるにつれだんだんと手が動かなくなってきたので、
次の勉強はpythonの練習問題を解く。
また、CNNの応用課題としてスマフォの振りかぶり方向検出(振りかぶり分類問題）を考えている。

ウニ’s blog