用語の整理:信頼性、可用性、故障率とか

的確につかいたいなと思って、整理してみる
- 信頼性 : Reliability
- 可用性 : Availability
- 平均故障間隔 : MTBF,「Mean Time Between Failures」
- 平均復旧時間 : MTTR,「Mean Time To Repair」
- 故障率 : failure rate
- 稼働率 : Operating Ratio
一行解説
- MTBF:どの程度故障が少なく稼動できるかの「信頼性」を示す指標
- MTTR:故障からどの程度で復旧できるの「可用性」を示す指標

わかりやすい
両者の違いは、「1000時間故障しないで稼働できるが、故障すると1000時間使えない機器」と、「99時間稼働すると、故障して1時間使えなくなる機器」で考えるとわかりやすい。この場合、前者は信頼性が高いといえる。一度稼働し始めれば確実に1000時間は動き続けるからで、故障間隔が短い。その一方で、後者は可用性が高いといえる。稼働率が99%だからだ。ちなみに前者の稼働率は50%である。
信頼性の低い機器でも、組み合わせることで可用性の高いシステムを作り上げることができる。1000時間稼働して1000時間使えない機器を2台用意し、それを交互に動作させるのだ。こうすればシステム全体としては常に使える状態ができるので、可用性は高くなる。このように2台以上の体制にすることを冗長化と呼ぶ。信頼性の低い機器も冗長化によって可用性の高いシステムを作れるのである。

良い図で見るといっぱつやな。こんな図かいて説明できるようにしたい。
MTBFとは「Mean Time Between Failures」の略称で、設備やシステムの「平均故障間隔」を意味します。
平均故障間隔とは、平均してどのくらいの期間に1回の故障が起きているかを示す値です。つまり、MTBFは生産設備が正常稼働を開始してから、次に故障するまでの時間の平均値を表します。MTBFの値が高いほど故障が起きにくく、信頼性が高い設備と評価できます。
MTBFに関連する言葉に「MTTR」があります。MTTRとは「Mean Time To Repair」の略称で、設備やシステムの「平均復旧時間」を意味する指標です。
平均復旧時間とは、設備やシステムが故障などにより停止したのち、修理を経て再稼動するまでのダウンタイムの平均を示す値で、一定期間内のダウンタイムの合計時間を故障した回数で割って求められます。つまり、MTTRの値が小さいほど、故障から復旧までの時間が短くなることを意味し、システムを継続的に稼働できる高い可用性を示します。