こんにちは。今回は、インフラ設計の中で良く出てくるMTBF、MTTRと稼働率の使い方と計算方法を解説します。両方ともシステムの信頼性を評価するための指標となります。情報処理試験でもよく出る単語なのでシステムエンジニアならだれでも知っておくべき単語でもあります。
基礎編では、個々の機器の稼働率の計算までを取り扱います。
- MTBF・・平均故障間隔。故障と故障のインターバル。
- MTTR・・平均修理時間。復旧・修理の所要時間
- 稼働率・・システムが故障せずに稼働してる時間の割合
MTBFとは何か?
MTBFは、Mean Time Between Failuresの略です。意味は冒頭で述べたとおり平均故障間隔であり、故障と故障の間の時間のことです。
言葉だけではイメージがわかないので、図を使ってご説明します。
下図のような間隔で故障しているシステムがあるとします。
MTBFは故障時間の間隔なので以下のような式で算出します。
(60時間 + 80時間 + 40時間)/ 故障3回 = 60時間
よってMTBFは60時間です。60時間システムが稼働すると故障が発生するという結果です。あくまでも平均なので60時間が絶対ではありませんが、故障発生頻度を測定する指標となります。
MTTRとは何か
MTTRは、 Mean Time To Repairの略です。
故障してから復旧するまでにかかる時間の平均です。直訳のとおり平均修理時間です。
こちらも例を使ってご説明します。
下図のような時間で修理しているシステムがあるとします。
この場合のMTTRは以下のように算出します。
(45分 + 15分 + 30分)/ 修理(故障)3回 = 30分
よってMTTRは30分です。こちらもあくまでも平均ですが、修理にかかる所要時間が目安となります。もし同一の故障なのでMTTRより大幅に時間がかかったトラブルや不手際があった可能性があるので、要チェックです。
MTTFとは何か?
少しマイナーですが、MTTFにも触れようと思います。MTTFは、 Mean Time To Failure の略称です。和訳すると平均故障間隔です。MTBFと近いように聞こえますが、大きく違う点があります。MTBFは、修理する前提の機器に対する値ですが、MTTFは故障したら終わりな機器に使用するものです。例えばDISKやメモリです。どのくらいの時間でHDDが壊れるのか?というものです。耐用年数に近いものがあります。
稼働率とは何か?
稼働率は、システムが故障しておらず正常に稼働している時間の割合です。
具体的な計算式は以下の通り。MTBFとMTTRの組み合わせです。
こちらも具体的な例で説明します。
下図のような稼働状況のシステムがあったとします。
この場合はこのように稼働率を計算します。
① MTBFの算出
(60時間 + 80時間 + 40時間)/ 故障3回 = 60時間
② MTTRの算出
(1時間 + 2時間 + 3時間)/ 修理(故障)3回 = 2時間
③ 稼働率の計算
60時間 ÷ ( 60時間 + 2時間) = 0.967 ≒ 稼働率 0.97
MTBFとMTTRの計算式さえわかれば計算は簡単です。
ただし実務で使う場合は難しいケースがあります。既存システムのであれば過去実績をベースに計算かのうですが、新規システムの場合は基礎値となる稼働時間・修理時間がありません。この場合は、ハードウェアベンダが開示してくれないかもしれませんが、ベンダに開示を依頼ましょう。
続きの応用編では、複数の機器が接続されている場合の稼働率の計算方法をご紹介します。よかったらご覧ください。