メディア

バックアップは「守り」の要、32万台の監視結果から分かったHDD選びの基準とは

大容量HDDは中堅・中小企業がNASやバックアップ用ファイルサーバを構築する際に役に立つ。このような用途でHDDを使う場合、「故障率」をなるべく低く保ちたい。どのようなHDDを選べばよいのだろうか。

» 2025年08月20日 07時00分 公開
[畑陽一郎キーマンズネット]

 企業にとって、ランサムウェアや自然災害などによるデータ損失のリスクは年々高まっており、情報セキュリティ対策の一環としてバックアップ環境の整備が欠かせない。特に中堅・中小企業では、コストを抑えつつ堅実なバックアップ体制を構築する手段として、NASやファイルサーバを活用するケースが一般的だ。こうした用途で用いる大容量HDDは、信頼性が極めて重要であり、中でも「故障率」の低さは重視すべき指標だ。では、実際にどのようなHDDを選べばよいのだろうか。

 HDDやSSDなどを数十万台規模で運用するBackblazeは2025年8月5日(現地時間)、自社のデータセンターにおけるHDDの故障率などを統計レポートとして発表した。2025年第2四半期(2025年4月1日〜同7月31日)、Backblazeは世界中のデータセンターに設置されたクラウドストレージサーバが内蔵する約32万台のHDDを監視していた。同社が公開したHDDの監視データを基に、ブランドや容量ごとの故障率などを紹介する。

 Backblazeが2025年6月30日時点で運用しているHDDは32万1201台あり、その大半の31万7230台を占めるのがデータ格納用だ(図1)*。ブランド別ではSeagate Technology(以下、Seagate)が34.84%と最も多く、次いでToshiba(32.84%)、Western Digital(23.72%)、HGST(8.62%)だった。

*起動専用ドライブが3971台ある。

図1 Backblazeが運用しているデータ格納用HDDの概要(提供:Backblaze)

32万台の監視結果から見えた、故障率の低いHDD

 データ格納用HDDの故障率の概要は図2の通りだ。

 年間平均故障率(AFR)は数字が小さいほど故障しにくいことを意味する。故障件数(Drives failed)を総稼働日数(Drive days)で割り、365を掛け、100倍して%表示した数値だ*。

*1061÷28402627×365×100=約1.363(1.36%)

図2 データ格納用HDDの故障率。Period:期間、Drive days:総稼働日数、AFR:年間平均故障率(提供:Backblaze)

 3種類ある期間(Period)はそれぞれ2025年第2四半期内(Quarterly Q2 2025)、年間(Annual 2024)、Lifetime(生涯、つまり通算)を意味する。

NAS用のHDDはどれでもよいのか

 中堅・中小企業を中心に、社内や部内のデータをNASに格納したり、バックアップ用途に利用したりしている企業は少なくない。NASはランサムウェアのようなサイバー攻撃の対策の一つとして役立ち、3-2-1ルールでバックアップを取る際の一つの構成要素としても有用だ。

 ではどのようにNAS用のHDDを選んだら良いだろうか。HDDは信頼性が高いから容量や価格だけを見ればよいという考え方は正しくない。なぜならNASに格納したデータの消失原因の46%がハードウェアの故障によるからだ。これはHDDの不具合と基板などのNAS本体の故障を併せた数字だ。データ復旧サービスを提供する企業の調査によれば、データトラブルの31%が物理障害、25%が論理障害だという。つまり、アプリケーションなどからのアクセスによってデータが壊れるよりも、HDDが物理的に故障する方が原因として大きいということが分かる。オンプレミスサーバの内蔵HDDがサーバ全体の故障に占める割合も約30%だという調査結果がある。サーバの故障に占めるHDDの割合も高い。


NASの信頼性を左右する指標とは?

 ごく短期間しか運用していないHDDや、台数が少ないモデルは統計的に意味がないため、総稼働日数が1万日以下だったり、台数が100台未満だったりしたものを除いたモデルの故障率を図3に示す*。今四半期はToshibaの「MG09ACA16TE」(容量16TB)が加わっている。

統計データから外したHDDは合計495台あった。本番稼働ではないテスト中のHDDが含まれる。総稼働日数では3つの基準から統計に含めるHDDを決めた。四半期ベースの統計ではHDDの台数が100台以下か、総稼働日数が1万日以下のものを除外し、年間ベースの統計では250台以下、5万日以下を除外した。生涯ベースでは500台以下、10万日以下を除外した。

図3 HDDのモデル別の故障率 項目は左からMFG:メーカー名(ブランド名)、Model:モデル名、Size:容量、Drive Count:台数、Avg.Age(months):平均稼働月数、Drive Days:総稼働日数、Failures:故障件数、AFR:2025年第2四半期の年間平均故障率(提供:Backblaze)

 図3の内容を前四半期と比較すると、四半期故障率はわずかに低下した。第1四半期の故障率は1.22%だったが、今回は1.36%だ。

 前四半期と今四半期の違いは幾つかある。

 まず、故障率が高かったモデルの一部で大幅に故障率が低下した。前四半期の故障率が9.47%と際立っていたSeagateのモデル「ST12000NM0007」(12TB)は、今四半期には3.58%まで低下した。このモデルのHDDの台数はほぼ横ばいだった(第1四半期:1038台、第2四半期:1014台)ため、見かけの故障率の変化ではなく、実際の故障率の変化だとBackblazeは指摘する。なお、さらに1つ前の四半期(2024年第4四半期)の故障率は8.72%だったため、次の四半期でどうなるか注目しているという。

 その他のモデルでも故障率が大きく下がったものがあった。HGSTの「HUH721212ALN604」(12TB)は第1四半期が4.97%、第2四半期が3.39%だった。Seagateの「ST14000NM0138」(14TB)は第1四半期が6.82%、第2四半期が4.37%だった。

 故障率が特に低かったモデルは6つあった。まず全く故障しなかったモデルは次の2つだ。特に8TBのモデルは3四半期連続で故障しておらず、優秀な成績だと言える。

Seagate「ST8000NM000A」(8TB)
・Seagate「ST16000NM002J」(16TB)

 次の4モデルは1台しか故障しなかった。

HGST「HMS5C4040BLE640」(4TB)
・Seagate「ST12000NM000J」(12TB)
・Seagate「ST14000NM000J」(14TB)
・Toshiba「MG09ACA16TE」(16TB)

生涯故障率はどうなっているのか

 四半期ごとの故障率の他に、Backblazeは生涯故障率も計算した。対象になったのは台数や稼働日数の条件を満たす27モデルの39万3907台だ(図4)。

図4 HDDのモデル別の故障率 項目は左からMFG:メーカー名(ブランド名)、Model:モデル名、Size:容量、Drive Count:台数、Avg.Age(months):平均稼働月数、Drive Days:総稼働日数、Failures:故障件数、AFR:生涯故障率故障率(提供:Backblaze)

 図4から分かることは幾つかある。まず生涯故障率自体の数値がわずかに低下しており、故障しにくくなっていることだ。2025年第1四半期時点の生涯故障率は1.31%だったが、今四半期は1.30%だった。

 HGST「HMS5C4040ALE640」(4TB)は古参のモデルだ。このモデルは生涯ベースの基準を満たしているため図4には含まれているが、四半期ベースの基準を満たしていないため、図3には含まれていない。四半期末時点で稼働中のHDDの数が不足していたためだ。これは珍しいことだという。四半期ベースに含まれているが、生涯ベースに含まれないことが通常だからだ。通常の動きを示しているのは、Seagate「ST8000NM000A」や同「ST14000NM000J」、同「ST16000NM002J」、Toshiba「MG09ACA16TE」だ。

「小容量」HDDの老朽化について何が分かったのか

 図4から分かるもう1つの事実は、12TB以下の小容量モデルが老朽化していることだ。図4にはそのようなモデルが13あり、全体の故障率は1.54%と高かった。小容量HDDだけを図5にまとめた。

図5 12TB以下のHDDのモデル別の生涯故障率 項目は左からMFG:メーカー名(ブランド名)、Model:モデル名、Size:容量、Drive Count:台数、Avg.Age(months):平均稼働月数、Drive Days:総稼働日数、Failures:故障件数、AFR:生涯故障率故障率(提供:Backblaze)

 図5の中で薄紫色で示したのが、導入以来5年以上経過した8モデルだ。オレンジ色は4年以上経過した2モデルだ。Backblazeによればこれらの10モデルは理論上の「偶発故障期」に達したモデルだという。偶発故障期とは故障率のバスタブ曲線モデル*における最も故障率が低くなる時期をいう。これらの10モデルを併せた生涯故障率は1.42%だった。

*バスタブ曲線は、時間の経過によるハードウェアの故障率の変化を示し、故障率が低下する「初期故障期」、故障率が低い水準のほぼ一定の値で推移する「偶発故障期」、故障率が上昇する「摩耗故障期」の3つの期間に区分される。

 特に注目すべきなのは、このAFRが他のモデルと比べて極端に低い故障率の低い「アウトライヤー」の影響を受けていることだという。Seagateの2モデル(どちらも4TBで、0.57%と0.40%)、 HGST「HUH721212ALE600」(12TB、0.56%)、Seagate「ST12000NM001G(12TB、0.99%)だ。

 さらに細かく見ていくと、5年以上運用されてきた8モデルのうち、5モデルが6年以上使用されているということだ(図6)。これらのモデルの生涯AFRは1.33%と低い。

図6 6年以上使用されてきた12TB以下の5モデルの生涯故障率 項目は左からMFG:メーカー名(ブランド名)、Model:モデル名、Size:容量、Drive Count:台数、Avg.Age(months):平均稼働月数、Drive Days:総稼働日数、Failures:故障件数、AFR:生涯故障率故障率(提供:Backblaze)

 図6の数値はバスタブ曲線の理屈には合致していないように見える。偶発故障期を過ぎて摩耗故障期に近づいているとすれば、故障率は上がるはずだからだ。そうではなくて、例外的に故障率が低い優れたモデルがあるとも加賀得られる。いずれにしてもこれらの小容量モデルの故障率は無視できない。なぜなら、Backblazeが生涯故障率を計算した39万3907台のうちこれらのモデルが15万6724台(約40%)を占めているからだ。

 後編では主に20TB以上の大容量モデルについて詳しく分析していく。

SaaSのデータはバックアップする必要があるのか

 HDDが役立つのはファイルサーバやNASだけではない。SaaSに置いたユーザーデータのバックアップにも利用できる。SaaSでは責任共有モデルに従って、ユーザーの誤操作や悪意のある操作、サイバー攻撃、同期ミスといった原因でユーザーデータが失われた場合、ユーザー側の責任になる。つまり、何らかの方法でユーザーがバックアップを取る必要がある。

 バックアップを取る際、SaaSベンダーが提供する有料バックアップ機能やサードパーティーのSaaSバックアップサービスを利用すれば、ユーザーがHDDを用意する必要はない。ただし、これらのサービスは追加費用が発生するため、データの量やバックアップポリシー(どの時点まで復旧させるか、復旧までにかかる最長時間をどの程度に設定するか)によって、ユーザーによるバックアップとの優位性が変わってくる。


Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。

アイティメディアからのお知らせ