読者です 読者をやめる 読者になる 読者になる

ウニ’s blog

勉強した結果を書いていきます

ゼロから作るDeepLearning本をやる(8)--最終回

8章終わり。今までの知識を元に、専門用語を用いてDeepLearningとは何かを説明。
ネットワーク構造がDeepなCNNということだった。
また、2015年のコンペ結果等ごく最近までの動向が大変よくわかった。

サンプルソースでは重み層8のVGGによるMNISTの認識。最終的な精度は99.35%になった。
以下は誤認識判定となった部分。
f:id:uni8inu:20161026215623p:plain

誤認識部分は人間でも判断に困る怪しい手書き文字ばかりだ。
誤認識の正解値(label値)と画像とを見比べると、うーむ。
なんともゲシュタルト崩壊するな。数字ってなんだっけ・・・。

まとめがてら箇条書きして終える。

  • 大規模画像認識コンペ(ILSVRC)が行われている
    • 本で解説したネットワークが優秀な記録を残している
    • AlexNet(2012),VGG(2014),ResNet(2015)
  • 高速化の案には、GPUによる高速化、分散学習、半精度浮動小数点数の活用がある
  • DeepLearningの応用としては、物体検出、セグメンテーション、画像キャプション表示がある
    • セグメンテーションには全結合層を用いないFCNを利用する
  • 教師なし学習には、行動と報酬をペアにした強化学習という分野がある
    • 強化学習の例としてDeepQ-Networkがある
    • DQNは最適行動価値関数のためにCNNを利用している

本が難しくなるにつれだんだんと手が動かなくなってきたので、
次の勉強はpythonの練習問題を解く。
また、CNNの応用課題としてスマフォの振りかぶり方向検出(振りかぶり分類問題)を考えている。