RAIDなんて飾りです!偉い人にはそれがわからんのです!!
冗談じゃありません、現状では可用性は100%に遠く及びません!
と、まあ判りやすいような判りにくいようなネタはさておき。
RAID組んでも、RAIDボードに不具合があるような場合は、ディスクの破損に対してサーバは無力ですね。
フェイルオーバークラスタリングをしていても、RAIDディスクセットは複数のサーバで共用しますから、そこが壊れると弱い。
RAIDのどれか1つのディスクが物理的にクラッシュしたという場合は、なんら問題なくリカバリできるのですが、RAIDボードに不具合があると全体が壊れてしまうことがある…。
最近直面しました(苦笑)
専用OS、専用コントローラ、専用ディスクだったころには考えにくかったトラブルですが、オープン化が進んだ現在では、サーバといえども「所詮PC」だったりします。
もちろんサーバ用のBIOS、サーバ用のCUP、サーバ向けのアーキテクチャ、サーバ用の運用管理ツールなどで、ただのPCよりずっとパフォーマンスも堅牢性も高いのですが、鉄板のような剛性を期待すると、痛い目にあうこともしばしばです。
まあ専用のころからみれば、コストパフォーマンスは天と地状態ですから、そこはリスクとして受け入れるべきなのかもしれません。
システム設計のときに、でも、ついついそこに目を瞑りたくなります。
クラスタリングするし、バックアップするし、だからまあ…一年に何回もおこるわけじゃないし、そのために大きなコストを掛けるのは善なのか?とか。
でも、"本当のダウン"のほかに、上記のようなRAID不具合による、簡単にはリカバリできないダウンというのもあります。
しかも原因がはっきりとわかるまで、この手の原因のディスク破損は、短いスパンで何度も起きてしまう傾向にあります。
サーバダウン時の縮退運用、当たり前といえば当たり前ですが、あるいは通常運用よりもずっと練りこんで設計する必要があるのかもしれません。
ただまあ、使われないほうがいい運用なので、そこが複雑な気分にさせますね。
|