あなたの「HDD」はいつまで使えるのか
HDDは大量のデータを保存するのに向くものの、いざ故障したときが怖い。HDDのメーカーや容量によって、故障率には違いがあり、製品選択の際に注意しなければならない。
クラウドストレージサービスを提供するBackblazeは世界中のデータセンターで10年以上大量のHDDとSSDを運用してきた。同社は2023年8月3日に自社のデータセンターにおけるHDDの故障率などを統計レポートとして発表した。2023年第2四半期(4〜6月)のデータだ。
同レポートによると、2022年第2四半期末の時点で、Backblazeは24万5757台のHDDとSSDを管理していた。そのうち4460台が起動ドライブ(3144台がSSD、1316台がHDD)だった。今回の統計レポートでは起動ドライブを除く24万1297台のHDDに焦点を当て、実際の故障率の他、「生涯故障率」も算出した。
どのHDDの故障率が高いのか
今回の統計レポートは、2023年第1四半期(1〜3月)に顧客データの保存に使用していたHDDを対象とした。分析したモデルはWestern DigitalのHGSTブランド、Seagate Technologyブランド(Seagate)、東芝ブランド、Western Digitalブランドだ。次の表に分析した31モデルを挙げた。
HDDの容量は4TB、6TB、8TB、12TB、14TB、16TBに分かれる。
2023年第2四半期におけるHDDの故障率 Backblazeがデータセンターで使用した4ブランド、31モデルのHDDの年間平均故障率(AFR)などを示した。表の項目は「メーカー名(ブランド名)」「モデル名」「容量」「台数」「平均稼働月数」「正常稼働日数」「故障台数」「年間平均故障率」(提供:Backblaze)
この表の中から故障台数がゼロだったモデルを抜き出したものが次の表だ。総稼働日数順に並べた。
一般に、統計的に意味がある結果を出すには、ある四半期中に少なくとも5万日の正常稼働日数がなければならない。上位3つのHDDはこの基準を満たす。3モデルのHDDの年間平均故障率(AFR)は0.13〜0.45%と低く、四半期中に故障がなかったことは納得できる。下位3モデルのHDDは、この四半期に5万日という条件を満たしていないが、2つのSeagateのモデルは幸先の良いスタートを切っていると言える。また、8年以上使用された東芝の4TBのHDD(モデル:MD04ABA400V)が、当四半期に故障ゼロを記録したことは注目すべきだろう。
最も古いHDDは?
全体の分析に入る前に、興味を引くトピックが幾つかある。まずは最も古いHDDだ。
平均使用月数が最も長い(古い)モデルはSeagateの6TBのモデル(ST6000DX000)で、98.3カ月(8.2年)だった。このモデルの中で最も古いHDDは104カ月(8.7年)も使用された。
運用中のモデルで最も古いのはSeagateの4TBのモデル(ST4000DM000)で、105.2カ月(8.8年)だ。Backblazeで最も古いのは、122カ月(10.2年)連続稼働のWestern Digitalの500GBのモデル(WD5000BPKT)だった。
年間平均故障率が増えた理由は?
今回の統計レポートで奇妙だったのは、HDDのAFRだ。2023年第2四半期のAFRは2.28%で、2023年第1四半期の1.54%よりも故障率が上がった。四半期ごとのAFRは変動しやすいとはいえ、さらなる調査が必要だという。今回のケースでは、HDD全体の運用年数が増えたため、ある程度AFRが増えることは予想できたが、それ以外の理由もあるはずだ。
次の表はHDDの容量別にAFRと運用月数をまとめたものだ。
以下では、5年以上経過したHDDを「古い」と定義する。Backblazeが購入したHDDの保証期間と合わせた定義だ(4TBと6TBのHDDの他、8TBのHDDの一部には2年保証だが、データの一貫性を保つために、HDDを古いと定義する期間は5年に合わせた)。
この定義にのっとると、登場して間もない12TB、14TB、16TBのHDDは「古くない」。そこで、4TBと6TB、8TB、10TBの古いHDDについて、過去3年間の四半期ごとにAFRをプロットすると次のようなグラフになった。
4TBと6TBのHDDはここ1年でわずかにAFRが増加したものの、ほとんど変化せず安定している。一方、8TB(平均しよう期間は5年)と10TB(同6年)のHDDはAFRがかなり増えた。この理由について、後述するようにBackblazeは統計レポートの中で解説した。
HDDの生涯AFRはどう変化したのか
Backblazeは顧客データの保存に用いた24万1297台のHDDを分析し、31のモデルごとに生涯AFRを算出した。生涯AFRは個々のHDDモデルの故障台数が変動することによる数値の急激な変動が少なく、モデルごとのAFRを示す指標として有効だと、Backblazeは述べている。ただし、確実な数値を得るには、相当な期間にわたる観測が必要だ。
2023年第2四半期におけるHDDの生涯AFR Backblazeがデータセンターで使用した4ブランド、31モデルのHDDの生涯AFRなどを示した。表の項目は「メーカー名(ブランド名)」「モデル名」「容量」「台数」「正常稼働日数」「故障台数」「年間平均故障率」「生涯AFRの信頼区間下側」「同上側」(提供:Backblaze)
寿命悪化の原因はこれだ
2023年第2四半期末における全HDDの生涯AFRは1.45%だった。これは前四半期の1.40%と比較して0.05ポイント増えた。前述したように、8TBと10TBのモデルのAFRが増えたことが主な要因だ。
生涯AFRについても8TBと10TBの影響が大きいのかどうか、BackblazeはHDDの容量別に両四半期における生涯AFRの差をグラフ化した。
全ドライブの生涯AFRは2023年第1四半期から同第2四半期まで0.05ポイント上がったため、ここが基準になる(赤線を引いた)。赤線より上に突き抜けている容量は生涯AFRを押し上げ、赤線より下は押しとどめる。グラフを見れば分かるように8TBと10TBのモデルが生涯AFR増加の原因だ。四半期のAFRと同じ結果になった。
8TBのモデルの台数(2万4891台)に対して、10TBの台数(1124台)は少ないため、Backblazeは8TBのモデルをさらに詳しく調べた。
8TBモデルの生涯AFRは、第1四半期の1.42%から第2四半期の1.59%に0.17ポイントも上昇した。稼働中の8TBモデルは6つあり、このうち3モデルが8TBモデル全体の故障の99.5%を占めた。
この3モデル全てで、2023年第1四半期から同第2四半期にかけての生涯AFRは10%以上増加しており、これは8TBモデル全体の12%増加と統計的に類似する。「8TBのHDDを置き換えるなら、この3つが候補になるだろう」とBackblazeは指摘した。SeagateブランドのST8000DM002は、他の2つのモデルより平均稼働月数が1年近く古いため、置き換える候補はこれだろう。
HDDの故障をどう捉えればよいのか
大量のHDDを運用するBackblazeは、HDDのAFRの増加をどう捉えているのだろうか。結論を言えば、同社はドライな態度を取っている。クラウドストレージビジネスを続ける限り、HDDは故障するからだ。同社は長年にわたり、さまざまなメーカーやブランドのHDDについて、モデルや容量ごとにAFRを観察してきた。HDDの故障に備えていなければ失敗するからだ。同社が統計レポートを公開するのは、必要なときに必要なだけ対策を打てるよう、利用環境を理解するための情報の一つとして使用するためだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- あなたの「SSD」はいつまで使えるのか
SSDは無音で動作するため、調子が良いのか悪いのか、よく分からない。いざ故障するとHDDと比較してデータのサルベージは難しい。どうすればよいのだろうか。 - 故障しやすいHDDはどれ? メーカーや容量に関係があるのか
大容量データを保存する際、HDDにはまだまだ優位性がある。だが、HDDは故障するかもしれない。どのメーカーの、さらにはどのモデルのHDDが故障しやすいのだろうか。