HDD 死亡

なにやら家の Linux が起動していないなぁと思って、調べてみたら起動途中で HDD が死亡しているメッセージが出ている。
念のためにソフトウェア RAID 1 で構成しておいた、データを格納している HDD が死亡していました。


これから、リカバリー作業です・・・orz
でも、やったことないから、手順がよく分からない(゚Д゚;)
google 先生にお伺いをかけながら、りかばりーしてきます。

追記1

なんか、google 先生のお伺い結果と、症状が違うぽ orz orz

追記2

FedoraCore ではソフトウェア RAID の構築に mdadm とかいうのが使われているらすぃ。

mdadm は設定ファイルを必要としないらしい。(でも /etc/mdadm.conf というのは存在する)

で、どこから設定をを読むのかというと、どうやら HDD のスーパーブロック?とかいうのにかかれている情報を使用するっぽい。
うちの PC では、/deb/md0 にたいして、マイナー番号 0 が振られている HDD が RAID ディスクとして使用されるようです。(/etc/mdadm.conf に書いてた)

ってことは、マイナー番号 0 が振られている HDD が発見できていないということか !?
2台とも壊れてたらどうしよう・・・orz

追記3

何かのはずみで 2 台ともよみとれないぽ。
とりあえず、RAID カード、ケーブルを疑ってみる。
これでだめだったら・・・((((;゚Д゚)))ガクガクブルブル

追記4

HDD は生きていることを確認。一安心。

追記5

結局、全部生きていました。
ケーブル類を刺し直したら復活!
ヨカターヨ・゚・(ノД`)・゚・

念のために、バックアップとっておこう・・・

追記6

ATA133のカードのBIOS画面みて、HDD が認識されていないことに気づいてたら、もそっと早く解決できたな。気づけよ漏れ!"(,,゚Д゚)∩"

追記7

あれ? cat /proc/mdstat の結果が・・・・

[netpenguin@hmx-12 ~]$ cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 hdh1[1]
      80413248 blocks [2/1] [_U]

unused devices: 
[netpenguin@hmx-12 ~]$

[2/1] って表示、( ゚Д゚)マズーな悪寒。

追記8

やはり、片肺だった模様。なんで、片肺になってしまってるんだろう・・・

[root@hmx-12]# /sbin/mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.01
  Creation Time : Sun Mar 13 12:35:27 2005
     Raid Level : raid1
     Array Size : 80413248 (76.69 GiB 82.34 GB)
    Device Size : 80413248 (76.69 GiB 82.34 GB)
   Raid Devices : 2
  Total Devices : 1
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Sat Aug 12 14:51:32 2006
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0


    Number   Major   Minor   RaidDevice State
       0       0        0       -1      removed
       1      34       65        1      active sync   /dev/hdh1
           UUID : 3f008674:12127a89:aa17e304:5b9ac106
         Events : 0.48662
[root@hmx-12]#

幸い、/dev/hdh1 の相方である /dev/hdg1 は生きているっぽいので、アレイ構成に突っ込み直せば医院だろうけど。

ってことで、テキトーに

[root@hmx-12]# /sbin/mdadm /dev/md0 --add /dev/hdg1

ってしてみた。 /sbin/mdadm --detail /dev/md0 で見てみると、なんか spare とかなっている。
気にせず再起動したら、/dev/hdh1 の内容を /dev/hdg1 にコピーしだしたので、問題ないのかな。

[root@hmx-12]# /sbin/mdadm --detail --scan
ARRAY /dev/md0 level=raid1 num-devices=2 UUID=3f008674:12127a89:aa17e304:5b9ac106
   devices=/dev/hdh1,/dev/hdg1
[root@hmx-12 k-ta]# cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 hdh1[1] hdg1[2]
      80413248 blocks [2/1] [_U]
      [==>..................]  recovery = 12.9% (10394752/80413248) finish=51.9min speed=22460K/sec
unused devices: <none>
[root@hmx-12]# /sbin/mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.01
  Creation Time : Sun Mar 13 12:35:27 2005
     Raid Level : raid1
     Array Size : 80413248 (76.69 GiB 82.34 GB)
    Device Size : 80413248 (76.69 GiB 82.34 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Sat Aug 12 16:48:03 2006
          State : clean, degraded, recovering
 Active Devices : 1
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 1


 Rebuild Status : 14% complete

    Number   Major   Minor   RaidDevice State
       0       0        0       -1      removed
       1      34       65        1      active sync   /dev/hdh1
       2      34        1        0      spare   /dev/hdg1
           UUID : 3f008674:12127a89:aa17e304:5b9ac106
         Events : 0.48750
[root@hmx-12]#

追記 9

コピーも無事、終了した模様。

[root@hmx-12]# cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 hdh1[1] hdg1[0]
      80413248 blocks [2/2] [UU]

unused devices: 
[root@hmx-12]# /sbin/mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.01
  Creation Time : Sun Mar 13 12:35:27 2005
     Raid Level : raid1
     Array Size : 80413248 (76.69 GiB 82.34 GB)
    Device Size : 80413248 (76.69 GiB 82.34 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Sat Aug 12 17:47:42 2006
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0


    Number   Major   Minor   RaidDevice State
       0      34        1        0      active sync   /dev/hdg1
       1      34       65        1      active sync   /dev/hdh1
           UUID : 3f008674:12127a89:aa17e304:5b9ac106
         Events : 0.48797
[root@hmx-12]#

コピーが完了したら、spare だった、 /dev/hdg1 がきちんと active sync になってた。