今日はインプット – 学習記録 #30

Pocket

おお、ついに次の記事で記念すべき30回目か。。。
と思ったら今回のが30回目だったらしい。
すごくね?

あまり大したことはできていないけれど、とりあえず継続できたことはすごいと自分をほめておく。

家でやったことと言えば、とりあえず少し記事を読んだよってくらいかな。

なので、今日はインプットしてました。
ちゃんとアウトプットしたい(n回目)

Kaggle

次に使うモデルであるところのR-CNNについて少し理解しておきたいなと思い、以下の記事をダラダラ読んでた(後半の実装とか数式は理解しきれてない)。7時過ぎくらいに家着いたはずなのに気づいたらこんな時間なのでマジでダラダラしていたんだと思う。
なんか、パソコンの挙動が遅くてどうにかして早くできないかとか調べたりしてて、メモリの増設をするかどうか迷ったりしてた。
とりあえず、Windowsのアプリケーションの更新をしてみることにしたよ。

読んだ記事についてまとめてみたよ

Deepに理解する深層学習による物体検出 by Keras

数式も混ぜて説明してはくれているがやはりかいつまんでいる感じが否めず(というか前提知識が足りない)、もっと勉強しないとちゃんと理解できないと感じた。

SSDの学習の仕方は割とわかりやすいというか、領域候補となるボックスと、画像をn×mのサイズに分割してそれぞれのマスについてクラス予測を行い、一番よさげなボックスを選択していくという感じだった。

ざっくりとしているがこんな感じ。

R-CNNについては物体を囲むバウンディングボックスの大きさと位置とかを教師データと照らし合わせて損失関数を出し、そこから計算していくイメージ。
ただ、計算量が多く、学習時間や予測時間がかかることが問題だった。

Fast-R-CNNは画像を大雑把に分けた領域ごとにプーリングするというRolプーリングという手法を使ってクラスとボックスの種類それぞれの損失を足し合わせたもので学習させていくもの。

Faster-R-CNNについては先ほどのFast-R-CNNにRPNという新たな構造を追加したもので、これによって大まかな領域をRPNで抽出してからFast R-CNNにかけることで学習の効率と計算の手間を省くというもの。

YOLOとかもあったけど、YOLOの改善版がSSDって位置づけっぽい。
バウンディングボックスありきでやっている感じ。

うーん、いつかはちゃんとした記事を書いて理解できるようになりたいな。

明日やること

明日はおやすみ

明日はたぶん、何もできないと思うから、何もやらないことにする。
サークルとかサークルとかが入っている。(というか土日くらい遊んでもいいよね)
という甘え考えで明日は楽しみます。

Pocket