HDDの大容量化が進み、エンタープライズ用途では20TB品の利用も珍しくなくなった。こうなると故障したときの損失が大きい。どのブランドのどのHDDが壊れにくいのだろうか。
HDDやSSDなどを数十万台規模で運用するBackblazeは2025年5月13日(現地時間)、自社のデータセンターにおけるHDDの故障率などを統計レポートとして発表した。2025年第1四半期(2025年1月1日〜同3月31日)の間で、Backblazeは世界中のデータセンターに設置されたクラウドストレージサーバが内蔵する約31万台のHDDを監視していた。その監視データを基に、ブランドや容量ごとの故障率などを紹介する。
Backblazeが運用しているHDDの大半を占めるのがデータ格納用だ。図1にはその概要を示した。データ保存用HDDは30万8861台あり、ブランド別ではSeagate Technology(以下、Seagate)が34.5%と最も多く、次いでToshiba(32.1%)、Western Digital(23.3%)、HGST(10.1%)だった。
具体的なモデル名は表1と表2を参照
表1は同社が運用していたHDDのうち、特定の条件*を満たした31万3742台のデータ格納用HDDを対象に、2025年第1四半期時点の年間平均故障率(AFR)と通算の生涯AFRを計算し、モデル別、容量別に示したものだ。
*2025年第1四半期全体では31万8426台のHDDを監視していた。このうち、ブートHDD(3970台)と2025年第1四半期終了時点で稼働中の台数が100台以下のモデル、第1四半期中の稼働日数が1万日以下のモデルを除外した。
表1の右端にあるAFRの意味と計算方法を説明しよう。AFRは年間平均故障率を示しているため、数字が小さいほど故障しにくい。
データからAFRを求めるには、求めたいモデルの故障件数をそのモデルの総稼働日数で割り、365を掛け、100倍して%表示にする。
表1の2行目にある「HGST HMS5C4040BLE640」であれば「3÷324039×365×100=0.337(%)」、つまり0.34%だ。
なお、この計算式から分かるようにAFRには運用中のHDDの台数は直接関係しない。
表1から分かることは4つあるという。
息が長い4TBモデル 4TBモデルは使用期間が長いものの、HGSTの「HMS5C4040ALE640」の故障台数はこの四半期でゼロ、同じく「HMS5C4040BLE640」のAFRは0.34%と低かった。
20TBモデルの故障率は低い 24TBのSeagate製品「T24000NM002H」はこの四半期で8件の故障があり、完璧とはいえない。それでも、このHDDのAFRは1.11%と低い。全HDDの平均AFRは1.42%だ。20TB以上のHDD群全体の平均AFRを見ると、0.72%であり、約半分という良い成績だった。
故障ゼロのHDDは4モデルあった このうち、Seagateの12TB製品を除く3モデルは2024年第4四半期にも故障がゼロだった。
ブランド | モデル | 容量 |
---|---|---|
HGST | HMS5C4040ALE640 | 4TB |
Seagate | ST8000NM000A | 8TB |
Seagate | ST12000NM000J | 12TB |
Seagate | ST14000NM000J | 14TB |
故障率が前四半期より微増 四半期のAFRを見ると、前四半期の1.35%から今四半期は1.42%に上昇した。比較的AFRの値が悪かったHDDは次の4モデルだ。2024年第4四半期(Q4)と2025年第1四半期(Q1)のAFRの値を示す。
ブランド | モデル | 容量 | Q4のAFR | Q1のAFR |
---|---|---|---|---|
Seagate | ST10000NM0086 | 10TB | 5.72% | 4.72% |
HGST | HUH721212ALN604 | 12TB | 5.15% | 4.97% |
Seagate | ST12000NM0007 | 12TB | 8.72% | 9.47% |
Seagate | ST14000NM0138 | 14TB | 5.95% | 6.82% |
表1は2025年第1四半期という3カ月間だけの故障の状況を示したものだ。ではもっと長い期間を観察したとき、何が分かるだろうか。
2025年第1四半期末時点で500台以上のHDDがあり、総稼働日数が10万日以上のモデルについて調査した生涯故障率のデータが表2だ。表2には31万2493台のHDDの結果が示されており、モデルの数は26だった。
表2が示す全モデルを通した生涯AFRの値は1.32%だ。これは2024年末時点の生涯AFRの値1.31%とほぼ同じであり、生涯AFRの値が安定していることが分かった。
ただし幾つかのモデルのAFRの値が大きく変化していた。
表3に示した4つのHDDは生涯AFRが改善した。
表3に挙げた最初の2つのHDDはいずれも四半期ごとの故障数がほぼ同じだった。東芝の20TBモデルとWestern Digitalの22TBモデルの故障数は2025年第1四半期の方が多かったものの、かなりの数のHDDを第1四半期に追加している。これは平均稼働月数を増やす効果があるので、故障数が増えるのは当然だという。
表4に示した5つのHDDは生涯AFRが悪化した。
Western Digitalの3モデルは生涯AFRが悪化したとはいえ、2025年第1四半期のAFRとしてはトップレベルだ。「WUH721816ALE6L0」(16TB)をみると0.45%から0.48%というわずかな悪化だが、もともとの数値が低いため、改善率としては悪い数字になってしまっている。
残りの2モデルはHGSTの12TBのHDDだ。どちらも2025年第1四半期の平均AFR(1.42%)を上回り、表4の1行目に挙げた「HUH721212ALE604」は1.45%、同じく2行目に挙げた「HUH721212ALN604」は2.06%だった。これは何を意味するのだろうか。
Backblazeによれば、HUH721212ALE604は故障率が1.45%と高いにもかかわらず「合格」だと考えられるという。なぜなら、平均稼働月数が67.1カ月(約5年半)と長いからだ。HDDなどの工業製品が従う故障曲線(バスタブカーブ)で定義された予想パターンに沿っているため、この高い故障率は正常な数字だと言える。
機械や装置の故障率を稼働開始から測定していくと、いわゆる「バスタブ曲線」(西洋風の風呂おけの形をした下に凸の故障率曲線)に当てはまることが多い。
バスタブ曲線は故障率が低下する「初期故障期」、故障率がほぼ一定で推移する「偶発故障期」、故障率が上昇する「摩耗故障期」の3つの期間に区分される。このような3つの期間に分かれる理由は、故障の原因が3つ(初期に多い初期故障、後期に多い摩耗故障、一定な水準を保つランダムな故障)あり、どの時点でもその和が実際の故障率になるためだ。
故障率が2.06%と高いHUH721212ALE604はバスタブ曲線では説明が付きにくいものの、今後も生涯AFRが増えていかない限り、大きな問題にはならないだろうという。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。