バックアップとリストアで問題になりがちなのが処理にかかる時間とデータ量だ。特にバックアップではデータ量を削減すればするほど時間とストレージ容量を節約できる。そのための技術が「重複排除」だ。
重複排除は、バックアップ対象のデータのうち同一のもの(重複データ)は1つしかバックアップしない技術だ。データの種類にもよるが、場合によっては99%ものデータ量削減ができることがある。
バックアップ対象側での重複排除、複数のサーバのデータを集めるバックアップサーバ側での重複排除を重ねて行うことでよりデータ量を小さくできる(図3)。低帯域なWAN経由でのリモートバックアップやクラウドストレージへのバックアップの場合にも有効だ。
なお、この技術は多くの製品に搭載されるようになったが、重複を見分ける単位(チャンク)の違いなどによる重複排除率の差もあるようだ。
従来、バックアップ時間短縮に有効なのが増分バックアップ、リストア時間短縮に適するのが差分バックアップといわれてきたが、最新ツールでは増分バックアップによりバックアップ時間を短縮しながら、バックアップサーバ側で自動的に増分をマージして常に最新のフルバックアップを作成する機能がある。
これを利用すれば、リストア時には増分バックアップのリストア順番などを考えないで済み、管理者の負担もリストア時間も削減可能になる。差分バックアップやフルバックアップの繰り返しの必要がなくなるわけだ。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。