ゼロから作るDeepLearning本をやる(4)
5章がギリギリ終わらなかった・・。
誤差逆伝播法での勾配計算の実装と、数値微分の結果を使って、勾配確認の実施まで行ったけど、どうにも結果に誤差がでかすぎてソース見直してたらこんな時間に。
ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
- 作者: 斎藤康毅
- 出版社/メーカー: オライリージャパン
- 発売日: 2016/09/24
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (2件) を見る
結局原因は自分で書いた部分のsoftmax関数がバッチ対応化出来てなかったという話。
そらで、行列化対応はまだ書けないなー。numpyの練習問題解く必要を激しく感じる。
この本を勧めるときに「python一切知らなくても読める!」とは言い難くなってきた。
特に今回はソース部分でnumpy行列変数に突然Tとかいうものが付いてるところがあり、「なんだこれ?行列にこんなメンバとかあるのか?」ってビックリした。
まぁとにかく行列への転置演算は".T"するだけでいけるらしい。
数学的表現にかなり近いかたちでソースが書けるのはまさにpythonすげえ。
さて、いよいよ進捗が悪いけど、明日はようやく6章。