2007年 01月 16日
たった1ブロックの不良で
管理しているサーバのうちの1台が,pingには応答しているのに,どうも正常稼動していないようだ,というのでsshでろぐいんしようとしたら,たしかにログインできない。
 HDDのIOエラーで固まることや,寒さでハングすることもあるので電源リセットしてもらったけどやはりおなじ。pingには応答するだけ。

 というわけで,現地に行ってディスプレイをつないで,エラーメッセージをみると,/varのパーティションで1ブロックだけリードエラーになっていてそれが繰り返し表示されている。

 開発元と相談して,/varのデータを外付けHDDにtarでコピーして,コピーできなかったファイルで重症度を判断することにした。するとdnsのスレーブデータとか,パッケージファイルとか,ほかから再生できそうなデータがほとんどだったので,/varパーティションの作成しなおしで対処することにした。

 といっても,私はそこまでディープな作業は超ひさしぶり。始めてといってもいいくらい。基本的な作業はむかしsun3でやったけど,もう10年以上前のはなし。あのころはmkfsでどういうパラメータを与えるとディスク容量を無駄なく使えるか,なんて話がfjなんたらであったなぁ。

 最近はすぐにあきらめて(それが普通だろう)別のHDDを用意してコピーするだけなんだけど,べつのHDDを用意して再インストールするより早く復旧できそうだったので

 1.ほかのパーティションも外付けHDDにdumpコマンドでバックアップ
 2.ddコマンドで/varのパーティションを初期化
 3.newfsコマンドでフォーマット
 4.tarファイルへ保存できたファイルを復元
 5.squidのキャッシュディレクトリを作成

で,起動に成功。でも,tarに保存する作業や,dsckコマンドで復旧を試みたりしたうえに,1,2の作業はそれぞれ2時間近くかかったので,全部で8時間くらいかかった。

 隣の学校では,ディスクのコピーツールの性能テストをしていて,そっちもディスクのジオメトリ情報設定を忘れていたために復旧に失敗したりして,作業終了は同じくらい。

 新年会をすっぽかすことになってしまった。
 最初は遅刻すると電話しようとしたんだけど,ケータイの電池が無くなったために,連絡する相手のケータイ電話番号もわからない(;_;)
 こういうときのための,USB充電器とか,積層電池充電器とかをかばんの底から見つけ出して「ごめんなさい」と大将に連絡できたのは「宴もたけなわ」のはずの時間(;_;)

 まぁ,どちらも対処できたので良しとしよう。

 ちなみに,去年も今年も,氏神様のおみくじでは「大吉」だったんだけどねぇ^_^;
[PR]

by ji3faf | 2007-01-16 03:34 | システム管理


<< 「どうしよう情報教育」勉強会 ...      女の一代記 >>


にほんブログ村 教育ブログへ




Map