2005年11月10日

SPOF(Single Point Of Failure)−単一故障点4

 SPOF=Single Point Of Failureは日本語で何と言ったらいいだろう?
 「単一故障」では故障のことを言っているようだし「Point」であることが分からない。自分は「単一故障点」と訳しているのだが、どうでしょうか?

 さて、システムの可用性を高める上で、最も重要で最も分かりやすい一つが、「単一故障点を無くす」ということだ。つまり、あらゆるハード、あらゆるソフトを二重化・冗長化して、一つが故障しても業務が継続できるようにしなければならない。

 ホストやRAIDは分かりやすいし、ベンダーが一番売り込んでくる所でもある。(まずはハードをたくさん売りたがっている)
 しかし、それだけでは十分ではない。待機用のマシンが運用中のマシンと同じラックに積んであったりしたら、二重化の効果はそれなりに減少してしまう。

 さらに、他にも冗長化しなければならないことがたくさんある。電源やバックアップ用の発電機は二重化されているか?それぞれの発電機は別の場所に置かれているか?発電機用の燃料は十分あるか?インターネットに接続する線は二重化されているか?複数のプロバイダーと接続しているか?
などなど・・・

以下は実際にあった例だ。

 あるユーザーでは、複数のインターネットプロバイダと接続し、もはや単一故障点は存在しないはずだった。
 にも関わらず、プロバイダがダウンした時、インターネット接続ができなくなってしまった。
 実は、よくよく調べてみると、二社目のプロバイダは一社目から回線をリースしている業者だったのだ。つまり、一社目の回線が繋がらなくなると、二社目の回線も繋がらなくなるのは当たり前の話だった。

(他の実例はまた次回)

11/22追記
 単一故障点という訳語については、こちらのブログ(私家版 ITプロフェッショナルの仕事術)も御参考。

トラックバックURL

この記事にコメントする

名前:
URL:
  情報を記憶: 評価: 顔