スケールする深層学習フレームワーク Cognitive Toolkit 2.0 を公開
[2017 年 6 月 1 日]
本日、マイクロソフトのオープンソースで、企業向けの品質で開発された深層学習フレームワーク Cognitive Toolkit 2.0 が一般提供開始されました。これは前に CNTK と呼ばれていたフレームワークで、2016 年 10 月にベータ版が登場し、今年の 4 月 3 日に製品候補版 (RC) が出ていたものです。複数の GPU、複数のマシンで大量のデータセットを用いてニューラルネットワークの計算を行う場合に効果的にスケールするのが特長です。
他のフレームワークとベンチマークを行うと、単体 GPU でも最善のパフォーマンスが得られます。
出典: https://dlbench.comp.hkbu.edu.hk/
複数 GPU を使った場合は、 GPU 数に応じてスケールすることが分かります。NVIDIA Volta GPU を複数個使ったベンチマークでは、64 個の V100 を使ったところまで良くスケールしている様子が見て取れます。
今回のリリースで実装されたトップ 3 の機能は以下の通りです。
- Keras サポートのパブリックプレビュー : Keras は Pythonで書かれた、オープンソースの高水準のニューラルネットワークライブラリで、ユーザーエクスペリエンスを重視して最適化しています。一貫性のあるシンプルな API を提供し、一般的な利用法府で必要なユーザーアクション数を最小に抑え、エラーに対してクリアでアクション可能なフィードバックを返します。Keras により機械学習のエクスペリエンスが簡単になり、より多くの人に深層学習が開放されました。この度、Keras レシピに変更を加えることなく Cognitive Toolkit 上で利用できるようになりました。
- BrainScript 以外のバインディングのサポート: バージョン 1.x でサポートしていた BrainScript に加えて、以下の言語がサポートされました。
- Python (versions 2.7, 3.4, and 3.5).
- C++.
- C#/.NET Managed.
- Java API (まだ実験段階)
- モデルの圧縮: トレーニングされたモデル、特にリアルタイムでカメラから送られてくる動画の画像認識などを、モバイルデバイスなどの遅い CPU で評価する場合、従来はパフォーマンスが出ませんでした。今回のリリースでモデルの圧縮がサポートされ、評価の精度をほぼ落とさずに高速化を実現しました。
メリーランド州アナポリスに本拠を置くChesapeake Conservancyは、マイクロソフトの研究者と協力して、このCognitive Toolkit を使用して最新の1メートル分解能の土地被覆データセットの作成を加速するニューラルネットワークを定義し、訓練を行いました (冒頭の地図の写真)。この情報は、6つの州とワシントンDCで約64,000平方マイルに及ぶチェサピーク湾全体の復旧と保護活動に優先順位を付けるために利用できます。
新しい Cognitive Toolkit 2.0 の特徴については、以下のビデオもご覧ください。
https://www.youtube.com/watch?v=jCzQPr-BBhk
関連記事
この文章は以下の原文を要約したものです:
- 2017/4/3:Microsoft Updates its Deep Learning Toolkit (Cortana Intelligence and Machine Learning Blog)
- 2017/4/12: Embarrassingly Parallel Image Classification, Using Cognitive Toolkit and TensorFlow on Azure HDInsight Spark (Cortana Intelligence and Machine Learning Blog)
- 2017/4/25: Using Microsoft’s Deep Learning Toolkit with Spark on Azure HDInsight Clusters (Cortana Intelligence and Machine Learning Blog)
- 2017/6/1: GA of Cognitive Toolkit 2.0 – Microsoft’s Open Source, Enterprise-Ready, TensorFlow-Outperforming AI Toolkit (Cortana Intelligence and Machine Learning Blog)
- 2017/6/1: Microsoft releases open-source toolkit to accelerate deep learning (The AI Blog)
- 2017/6/1: Microsoft’s high-performance, open source, deep learning toolkit is now generally available (The Cognitive Toolkit Blog)
- CNTK 2.0 Release Notes