データの耐久性と高可用性を両立する Windows Azure ストレージの消失訂正符号技術
Windows Azure の性能向上のため、絶えず研究開発が行われています。
USENIX Annual Technical Conference 2012 で Microsoft Research と Windows Azure Storage チームの共同研究による論文である Erasure Coding in Windows Azure Storage が Best Paper Award を受賞しました。
Windows Azure ストレージ サービスは、高可用性と強い一貫性を両立、パーティション分割されたグローバルな名前空間、障害復旧が実装されています。データの耐久性と高可用性を実現するなかで、ストレージのオーバーヘッドを削減するために Erasure Coding (消失訂正符号処理) を行っており、今回の論文では、Windows Azure ストレージにおける Erasure Coding の仕組みについて説明しています。
Erasure Coding は消失したビット列を復元する技術で、マイクロソフトは Local Reconstruction Codes (LRC: ローカル再構築コード) と呼ばれる新しいコードセットを開発しました。この LRC によって、オフラインになっているデータフラグメントを再構築するために読み込みが必要な Erasure Coding を削減し、ストレージにおけるオーバーヘッドを低減することが可能になりました。このような技術により、Windows Azure ストレージは、読み取り遅延を抑えながら、オーバーヘッドの少ない耐久性の高いストレージを提供しています。
Windows Azure ストレージの内部については、SOSP で発表された論文である Windows Azure Storage: A Highly Available Cloud Storage Service with Strong Consistency (原文 / 日本語訳) をご覧下さい。
Window Azure Team Blog > USENIX Best Paper Award: Erasure Coding in Windows Azure Storage