HDD 死亡
なにやら家の Linux が起動していないなぁと思って、調べてみたら起動途中で HDD が死亡しているメッセージが出ている。
念のためにソフトウェア RAID 1 で構成しておいた、データを格納している HDD が死亡していました。
これから、リカバリー作業です・・・orz
でも、やったことないから、手順がよく分からない(゚Д゚;)
google 先生にお伺いをかけながら、りかばりーしてきます。
追記1
なんか、google 先生のお伺い結果と、症状が違うぽ orz orz追記2
FedoraCore ではソフトウェア RAID の構築に mdadm とかいうのが使われているらすぃ。mdadm は設定ファイルを必要としないらしい。(でも /etc/mdadm.conf というのは存在する)
で、どこから設定をを読むのかというと、どうやら HDD のスーパーブロック?とかいうのにかかれている情報を使用するっぽい。
うちの PC では、/deb/md0 にたいして、マイナー番号 0 が振られている HDD が RAID ディスクとして使用されるようです。(/etc/mdadm.conf に書いてた)
ってことは、マイナー番号 0 が振られている HDD が発見できていないということか !?
2台とも壊れてたらどうしよう・・・orz
追記3
何かのはずみで 2 台ともよみとれないぽ。とりあえず、RAID カード、ケーブルを疑ってみる。
これでだめだったら・・・((((;゚Д゚)))ガクガクブルブル
追記4
HDD は生きていることを確認。一安心。追記5
結局、全部生きていました。ケーブル類を刺し直したら復活!
ヨカターヨ・゚・(ノД`)・゚・
念のために、バックアップとっておこう・・・
追記6
ATA133のカードのBIOS画面みて、HDD が認識されていないことに気づいてたら、もそっと早く解決できたな。気づけよ漏れ!"(,,゚Д゚)∩"追記7
あれ? cat /proc/mdstat の結果が・・・・[netpenguin@hmx-12 ~]$ cat /proc/mdstat Personalities : [raid1] md0 : active raid1 hdh1[1] 80413248 blocks [2/1] [_U] unused devices:[netpenguin@hmx-12 ~]$
[2/1] って表示、( ゚Д゚)マズーな悪寒。
追記8
やはり、片肺だった模様。なんで、片肺になってしまってるんだろう・・・[root@hmx-12]# /sbin/mdadm --detail /dev/md0 /dev/md0: Version : 00.90.01 Creation Time : Sun Mar 13 12:35:27 2005 Raid Level : raid1 Array Size : 80413248 (76.69 GiB 82.34 GB) Device Size : 80413248 (76.69 GiB 82.34 GB) Raid Devices : 2 Total Devices : 1 Preferred Minor : 0 Persistence : Superblock is persistent Update Time : Sat Aug 12 14:51:32 2006 State : clean, degraded Active Devices : 1 Working Devices : 1 Failed Devices : 0 Spare Devices : 0 Number Major Minor RaidDevice State 0 0 0 -1 removed 1 34 65 1 active sync /dev/hdh1 UUID : 3f008674:12127a89:aa17e304:5b9ac106 Events : 0.48662 [root@hmx-12]#
幸い、/dev/hdh1 の相方である /dev/hdg1 は生きているっぽいので、アレイ構成に突っ込み直せば医院だろうけど。
ってことで、テキトーに
[root@hmx-12]# /sbin/mdadm /dev/md0 --add /dev/hdg1
ってしてみた。 /sbin/mdadm --detail /dev/md0 で見てみると、なんか spare とかなっている。
気にせず再起動したら、/dev/hdh1 の内容を /dev/hdg1 にコピーしだしたので、問題ないのかな。
[root@hmx-12]# /sbin/mdadm --detail --scan ARRAY /dev/md0 level=raid1 num-devices=2 UUID=3f008674:12127a89:aa17e304:5b9ac106 devices=/dev/hdh1,/dev/hdg1 [root@hmx-12 k-ta]# cat /proc/mdstat Personalities : [raid1] md0 : active raid1 hdh1[1] hdg1[2] 80413248 blocks [2/1] [_U] [==>..................] recovery = 12.9% (10394752/80413248) finish=51.9min speed=22460K/sec unused devices: <none> [root@hmx-12]# /sbin/mdadm --detail /dev/md0 /dev/md0: Version : 00.90.01 Creation Time : Sun Mar 13 12:35:27 2005 Raid Level : raid1 Array Size : 80413248 (76.69 GiB 82.34 GB) Device Size : 80413248 (76.69 GiB 82.34 GB) Raid Devices : 2 Total Devices : 2 Preferred Minor : 0 Persistence : Superblock is persistent Update Time : Sat Aug 12 16:48:03 2006 State : clean, degraded, recovering Active Devices : 1 Working Devices : 2 Failed Devices : 0 Spare Devices : 1 Rebuild Status : 14% complete Number Major Minor RaidDevice State 0 0 0 -1 removed 1 34 65 1 active sync /dev/hdh1 2 34 1 0 spare /dev/hdg1 UUID : 3f008674:12127a89:aa17e304:5b9ac106 Events : 0.48750 [root@hmx-12]#
追記 9
コピーも無事、終了した模様。[root@hmx-12]# cat /proc/mdstat Personalities : [raid1] md0 : active raid1 hdh1[1] hdg1[0] 80413248 blocks [2/2] [UU] unused devices:[root@hmx-12]# /sbin/mdadm --detail /dev/md0 /dev/md0: Version : 00.90.01 Creation Time : Sun Mar 13 12:35:27 2005 Raid Level : raid1 Array Size : 80413248 (76.69 GiB 82.34 GB) Device Size : 80413248 (76.69 GiB 82.34 GB) Raid Devices : 2 Total Devices : 2 Preferred Minor : 0 Persistence : Superblock is persistent Update Time : Sat Aug 12 17:47:42 2006 State : clean Active Devices : 2 Working Devices : 2 Failed Devices : 0 Spare Devices : 0 Number Major Minor RaidDevice State 0 34 1 0 active sync /dev/hdg1 1 34 65 1 active sync /dev/hdh1 UUID : 3f008674:12127a89:aa17e304:5b9ac106 Events : 0.48797 [root@hmx-12]#
コピーが完了したら、spare だった、 /dev/hdg1 がきちんと active sync になってた。