2007年 08月 05日
このところサーバが立て続けにトラブル
■SCSI HDDにアクセスできないとのたまうサーバ機
デバイス\Device\Scsi\adpu160m1はタイムアウト期限内に応答しませんでした
とWindowsのイベントログに記録されて、HDD(RAID5)がハングするという事態が3日に1度の割合で発生。ところが、SCSI I/Fの販売記録がないと保守会社がいう。
 おいおい。と言っているまにそのRAID5のドライブがお亡くなりになった。リビルド中にBadBlockが発生してエラー。BadBlockCheckは週一回実行しているが、このトラブルで実施しなかったら、そういうときに限って発生する。
 BadBlockを無視してリビルドさせて、BadBlockCheckをさせている最中。
 でも、データファイルが死んだ。先週のバックアップはあるけど、この状況だからまともなデータなのかどうか怪しい。そのときはトラブル発生前の2週間前のバックアップファイルを使わなければならない。

■午前4時に自動停止するサーバ
 イベントログを見ると、シャーシ内温度が高いので止めるという記録が残っていた。サーバ監視プログラムを使って、各部を点検すると、電源ユニットのファンが止まったり、動いたり。
 丁寧にファン周りを掃除したら安定して回転したので安心していたが、やっぱり止まる。

まぁ、5年もあまりよろしくない環境にさらされたマシンなので、よく持ったほうだと褒めてあげないといけないのかもしれない。
[PR]

by ji3faf | 2007-08-05 22:43 | システム管理


<< ぜひ再放送のリクエストを【わか...      結婚式に参加 >>


にほんブログ村 教育ブログへ




Map