Benutzer-Werkzeuge

Webseiten-Werkzeuge


infrastruktur:rz:storage-server:raid-rebuild

raid-rebuild

Versionen

Version Bearbeiter Änderungsdatum Änderungsbemerkung
0.1 hase 25-06-2021 Seite angelegt

Raid Rebuild auf Naproxen

Zuordnung Platte zu Device im OS

Die Slots in dem Plattenrahmen unterhalb des Servers sind von links beginnend von 0 bis 14 durchnummeriert. Dies kommt 1:1 aufgrund diesem udev Zusatz Shackspace Git udev sas enclosure auch im OS an.

Beispiel: Slot4 ist defekt. Dann ist es im Plattenrahmen die Platte 5 (0→1→2→3→4) von links.

1. Welche Platte ist defekt?

zpool status

root@naproxen:~# zpool status
  pool: pool_data
 state: DEGRADED
status: One or more devices is currently being resilvered.  The pool will
	continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Fri Jun 25 01:51:56 2021
	3.63T scanned at 582M/s, 2.24T issued at 359M/s, 3.63T total
	227G resilvered, 61.75% done, 0 days 01:07:35 to go
config:

	NAME               STATE     READ WRITE CKSUM
	pool_data          DEGRADED     0     0     0
	  raidz2-0         DEGRADED     0     0     0
	    spare-0        DEGRADED     0     0     0
	      replacing-0  DEGRADED     0     0     0
	        old        OFFLINE      8   591     0
	        slot4      ONLINE       0     0     0  (resilvering)
	      slot14       ONLINE       0     0     0
	    slot5          ONLINE       0     0     0
	    slot6          ONLINE       0     0     0
	    slot7          ONLINE       0     0     0
	    slot8          ONLINE       0     0     0
	    slot9          ONLINE       0     0     0
	    slot10         FAULTED     19     4     0  too many errors         <<<--- die ist kaputt
	    slot11         ONLINE       0     0     0
	    slot12         ONLINE       0     0     0
	    slot13         ONLINE       0     0     0
	spares
	  slot14           INUSE     currently in use

2. Platte offline schalten

zpool offline pool_data /dev/mapper/slot4

3. LUKS Container stoppen

cryptdisks_stop slot4

4. Platte tauschen

Bitte jetzt die Platte rausziehen und austauschen.

5. Device Name von neuer Platte finden

dmesg | tail -n 20

Finde den sdx Namen

6. Platte mit LUKS formatieren

cryptsetup luksFormat /dev/disk/by-slot/4 --key-file ~/.luks/slot4

Die Slotnummer und den Namen des Keyfiles bitte anpassen!

7. LUKS öffnen

cryptsetup luksOpen /dev/disk/by-slot/4 slot4 --key-file ~/.luks/slot4

                       ^-- Platte        ^-- LUKS Name (siehe /dev/mapper/slotx)

8. "Tausche" in ZFS die Platte aus

zpool replace pool_data /dev/mapper/slot4

Danach wird die Platte aufgenommen und ein Resilver des Raids.

9. Prüfe den Resilver-Status

watch -n 1 zpool status pool_data
root@naproxen:~# zpool status pool_data
  pool: pool_data
 state: DEGRADED
status: One or more devices is currently being resilvered.  The pool will
	continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Fri Jun 25 01:51:56 2021
	3.63T scanned at 340M/s, 3.59T issued at 336M/s, 3.63T total
	364G resilvered, 98.79% done, 0 days 00:02:17 to go
config:

	NAME               STATE     READ WRITE CKSUM
	pool_data          DEGRADED     0     0     0
	  raidz2-0         DEGRADED     0     0     0
	    spare-0        DEGRADED     0     0     0
	      replacing-0  DEGRADED     0     0     0
	        old        OFFLINE      8   591     0
	        slot4      ONLINE       0     0     0  (resilvering)
	      slot14       ONLINE       0     0     0
	    slot5          ONLINE       0     0     0
	    slot6          ONLINE       0     0     0
	    slot7          ONLINE       0     0     0
	    slot8          ONLINE       0     0     0
	    slot9          ONLINE       0     0     0
	    slot10         FAULTED     19     4     0  too many errors
	    slot11         ONLINE       0     0     0
	    slot12         ONLINE       0     0     0
	    slot13         ONLINE       0     0     0
	spares
	  slot14           INUSE     currently in use
infrastruktur/rz/storage-server/raid-rebuild.txt · Zuletzt geändert: 2022-12-02 20:17 von are