可用性対策

可用性:availabilityとは、必要なタイミングで、 要求されるサービスを提供できるシステム性能のことです。
サービスが利用できなければ、そのサービスで獲得できたはずの 利益が失われてしまします。(→利益機会逸失と言います)

可用性が高いということは、障害が発生しにく、障害が発生しても その障害規模が小さく、修復が早いということです。
つまり可用性対策とは、可用性を高めるための対策です。
そのためには、日頃から障害が起きないように 「運用面での対策」 と 「障害や災害が起きた場合の対策」 を行う必要があります。
そのためには、起こりえる障害を予想して、項目を洗い出し、 それら項目に対して、事前に策を講じなければなりません。

可用性対策として用いられる基本的な考え方には、 システムの個々の構成要素の信頼性を高めて故障そのものを起こさないようにする 『フォールトアボイダンス』(Fault Avoidance)と、 故障しても問題が大きくならないように工夫する 『フォールト・トレランス』(Fault Tolerance:耐障害性) の2つの考え方があります。 (fault”は欠点、失敗の意味で、“tolerance”は耐久力の意味の語です。

フォールト・トレランスには、冗長性を持たせて信頼性を高める方法が使われます。 例えばシステムの一部が故障しても、全体には影響を与えずに処理を続け、 その間に故障部分を修理できるようにするわけです。 それには無停電電源装置の導入や、交換のし易さなども含みます。
これを発展させて、故障してもシステムが停止することなく処理を継続し続けるシステムを フォールトトレランスシステムと呼びます。 (ノンストップコンピュータに要求される技術といえます。)

フォールト・トレランスの性能を上げる場合、
フェールソフト(fail soft)とフェールセーフ(fail safe)の 考え方があります。

また、障害時につながる可能性を下げる考えの一つで、 フールプルーフ(fool proof)が挙げられます。 これは、利用者が誤った操作をしても障害がおきないように 設計の段階で安全対策を施しておくことです。
(例:電池の+と−を逆にした時、セットできないような構造など)
直訳すれば「愚か者にも耐えられる」で、「人間はミスするもの」を前提に した安全設計です。