2013年明けましておめでとうございます。
Mastering OpenCV with Practical Computer Vision Projectの第8章の顔認識は、4つのStepで構成されている。
今回は、Step3のトレーニング画像の収集に関して。
カメラ画像を前処理した画像を収集して、ラベルを付与してトレーニングを行う。
トレーニング結果はファイル等に保存し、後で誰の顔かのテストを行うときに使用する。
トレーニング用の画像は、トレーニングセット、テスト用の画像をテストセットとする。
トレーニング用の画像は、さまざまな状態の画像にしたほうがよい。
顔の角度、表情、照明状況などいろいろ変えてみる
一般的に、一人につき100枚の画像が必要だが、ほとんど同じような画像であれば意味がない
30fpsのカメラであれば、数秒で100間枚になるため、ほとんど同じイメージになる
そこで明示的に遅延を入れ、1秒に付き1枚とする。また、イメージが似ているかどうか判断し
似ていない場合のみ、その画像を使用する
似ているかの判断は、2枚の画像を画素ごとに比較し、相対的なL2 erroeを求める。
(2つの値の差の合計のルートをとった値である)
どちらかの方向に動いた場合、L2 errorの値は大きくなる。
ここでは、0.3を閾値とする。
顔のバリエーションの作成には、いくつかの手法がある
顔を反転させる ノイズを加える 数画素シフトさせる 数%拡大縮小させる 数度回転させる
顔を採用した場合、白枠で囲む
次回は、いよいよ本題の認識のトレーニングとなる
書いている間にいつの間にか年が明けていた。
本年、がんばっていくつかのアプリケーションを作りたい。
いずれここで報告したいという抱負を抱く。 2013 元日
0 件のコメント:
コメントを投稿