はじめに
7月中旬に予定されていたリリース日より遅れ、8/4にようやく正式版がリリースされた。今回の目玉は、RCで述べられているようにdnnモジュールが、contribからcoreに移動したことである。
その他は、リリースノートに記載されている。
3.3.rcのビルドに関しては、ここに記載している。
この時CPUの最適のオプションがよく分からなかった。
今回何も指定せずデフォルトでためしたところ、以下のように設定されている。
-- CPU/HW features:
-- Baseline: SSE SSE2 SSE3
-- requested: SSE3
-- Dispatched code generation: SSE4_1 SSE4_2 FP16 AVX AVX2
-- requested: SSE4_1 SSE4_2 AVX FP16 AVX2
-- SSE4_1 (2 files): + SSSE3 SSE4_1
-- SSE4_2 (1 files): + SSSE3 SSE4_1 POPCNT SSE4_2
-- FP16 (1 files): + SSSE3 SSE4_1 POPCNT SSE4_2 FP16 AVX
-- AVX (5 files): + SSSE3 SSE4_1 POPCNT SSE4_2 AVX
-- AVX2 (7 files): + SSSE3 SSE4_1 POPCNT SSE4_2 FP16 FMA3 AVX AVX2
Baseline はmustの機能であり、CPUがここで指定したアーキテクチャをサポートしていないと、プログラムは実行されない。
Dispatched code generation は、CPUがここで指定したアーキテクチャをサポートしている場合、Dispatchにより最適化のコードが実行されるとのこと
これまで何度もビルドしている設定なので、問題ななく終了した。ただ、tbbのpchが使用できない警告は多々表示されるが、問題ないので放置している。
以上
0 件のコメント:
コメントを投稿