2013年1月1日火曜日

Mastering OpenCVの第8章の顔認識のメモ step3 前半

2013年明けましておめでとうございます。

Mastering OpenCV with Practical Computer Vision Projectの第8章の顔認識は、4つのStepで構成されている。

今回は、Step3のトレーニング画像の収集に関して。

 カメラ画像を前処理した画像を収集して、ラベルを付与してトレーニングを行う。
 トレーニング結果はファイル等に保存し、後で誰の顔かのテストを行うときに使用する。

 トレーニング用の画像は、トレーニングセット、テスト用の画像をテストセットとする。

 トレーニング用の画像は、さまざまな状態の画像にしたほうがよい。
 顔の角度、表情、照明状況などいろいろ変えてみる

 一般的に、一人につき100枚の画像が必要だが、ほとんど同じような画像であれば意味がない
 30fpsのカメラであれば、数秒で100間枚になるため、ほとんど同じイメージになる

 そこで明示的に遅延を入れ、1秒に付き1枚とする。また、イメージが似ているかどうか判断し
 似ていない場合のみ、その画像を使用する

 似ているかの判断は、2枚の画像を画素ごとに比較し、相対的なL2 erroeを求める。
 (2つの値の差の合計のルートをとった値である)

 どちらかの方向に動いた場合、L2 errorの値は大きくなる。
 ここでは、0.3を閾値とする。

 顔のバリエーションの作成には、いくつかの手法がある
 顔を反転させる ノイズを加える 数画素シフトさせる 数%拡大縮小させる 数度回転させる
 
 顔を採用した場合、白枠で囲む

 次回は、いよいよ本題の認識のトレーニングとなる


書いている間にいつの間にか年が明けていた。
本年、がんばっていくつかのアプリケーションを作りたい。

いずれここで報告したいという抱負を抱く。 2013 元日 

0 件のコメント:

コメントを投稿