2014年12月9日火曜日

Caffe のモデル配布に関して訳してみた

オリジナルのドキュメントはここ

Caffe Model Zoo

多くの人が、AlexNet-alikesのような単純な回帰から、音声アプリケーションへの画像の類似性のためのSiameseネットワークまで、Caffeを異なる構成のモデル学習に使用し、異なる課題に適用した。これらのモデルの共有の摩擦を少なくするため、モデルZOOのフレームワークを紹介する

  • Caffeモデル情報をパッケージするための共通フォーマット
  • Githubへのモデルのuploadツールや、学習済み.caffemodel binariesのダウンロードツール
  • モデル情報共有のwiki

学習済みデータの取得方法

まずはじめに学習済みのモデルデータを提供する。
scripts/download_model_binary.py <dirname> 
のスクリプトを実行することで各データをダウンロードできる

dirnameは以下のものが使用できる

models/bvlc_reference_caffenet
 BVLC Reference CaffeNet : ILSVRC 2012で学習, NIPS 2012 paperを若干変更.

models/bvlc_alexnet
 BVLC AlexNet : ILSVRC 2012で学習, NIPS 2012とほぼ同じ

models/bvlc_reference_rcnn_ilsvrc13
 BVLC Reference R-CNN ILSVRC-2013 : caffe版のR-CNN

ユーザが作成したモデルは、wiki pageにUPされている。

モデル情報フォーマット

以下の内容を含むディレクトリーでモデルは配布されている
・Solver/model prototxt
・readme.md
 学習用のcaffeのバージョン
 オプション caffemodelのファイルURLとSHA1
 オプション githubのgist id
 何のモデルかの情報
 ライセンス情報
・オプションで、役立つスクリプト

モデル情報のホスティング

Github Gistは、複数のファイルを含むことができ、バージョン管理ができ、ブラウザで見れる記述ができるので、モデル配布に適したフォーマットである。

scripts/upload_model_to_gist.sh <dirname> で、Github Gistへのバイナリーを含まないモデルディレクトリーのファイルをUPし、Gist IDを表示する。
もし、gist_idが、<dirname>/readme.mdのfront matterの一部の場合、従来のものを更新する。

scripts/upload_model_to_gist.sh models/bvlc_alexnet を試してみれば良い。削除を忘れずに
scripts/download_model_from_gist.sh <gist_id> <dirname>でダウンロードできる

学習データのホスティング

Caffe modelファイルのホストは、ユーザ次第である。BVLCのモデルは、我々のサーバを使用している。Dropboxはふさわしいであろう。?dl=1をURLにつけるていることを確認

scripts/download_model_binary.py <dirname> は、<dirname>/readme.md のURLを使用し、Caffe modelをダウンロードし、SHA1の検査を行う。

0 件のコメント:

コメントを投稿