infrastruktur:rz:storage-server:raid-rebuild
Inhaltsverzeichnis
raid-rebuild
Versionen
Version | Bearbeiter | Änderungsdatum | Änderungsbemerkung |
0.1 | hase | 25-06-2021 | Seite angelegt |
Raid Rebuild auf Naproxen
Zuordnung Platte zu Device im OS
Die Slots in dem Plattenrahmen unterhalb des Servers sind von links beginnend von 0 bis 14 durchnummeriert. Dies kommt 1:1 aufgrund diesem udev Zusatz Shackspace Git udev sas enclosure auch im OS an.
Beispiel: Slot4 ist defekt. Dann ist es im Plattenrahmen die Platte 5 (0→1→2→3→4) von links.
1. Welche Platte ist defekt?
zpool status
root@naproxen:~# zpool status pool: pool_data state: DEGRADED status: One or more devices is currently being resilvered. The pool will continue to function, possibly in a degraded state. action: Wait for the resilver to complete. scan: resilver in progress since Fri Jun 25 01:51:56 2021 3.63T scanned at 582M/s, 2.24T issued at 359M/s, 3.63T total 227G resilvered, 61.75% done, 0 days 01:07:35 to go config: NAME STATE READ WRITE CKSUM pool_data DEGRADED 0 0 0 raidz2-0 DEGRADED 0 0 0 spare-0 DEGRADED 0 0 0 replacing-0 DEGRADED 0 0 0 old OFFLINE 8 591 0 slot4 ONLINE 0 0 0 (resilvering) slot14 ONLINE 0 0 0 slot5 ONLINE 0 0 0 slot6 ONLINE 0 0 0 slot7 ONLINE 0 0 0 slot8 ONLINE 0 0 0 slot9 ONLINE 0 0 0 slot10 FAULTED 19 4 0 too many errors <<<--- die ist kaputt slot11 ONLINE 0 0 0 slot12 ONLINE 0 0 0 slot13 ONLINE 0 0 0 spares slot14 INUSE currently in use
2. Platte offline schalten
zpool offline pool_data /dev/mapper/slot4
3. LUKS Container stoppen
cryptdisks_stop slot4
4. Platte tauschen
Bitte jetzt die Platte rausziehen und austauschen.
5. Device Name von neuer Platte finden
dmesg | tail -n 20
Finde den sdx Namen
6. Platte mit LUKS formatieren
cryptsetup luksFormat /dev/disk/by-slot/4 --key-file ~/.luks/slot4
Die Slotnummer und den Namen des Keyfiles bitte anpassen!
7. LUKS öffnen
cryptsetup luksOpen /dev/disk/by-slot/4 slot4 --key-file ~/.luks/slot4 ^-- Platte ^-- LUKS Name (siehe /dev/mapper/slotx)
8. "Tausche" in ZFS die Platte aus
zpool replace pool_data /dev/mapper/slot4
Danach wird die Platte aufgenommen und ein Resilver des Raids.
9. Prüfe den Resilver-Status
watch -n 1 zpool status pool_data
root@naproxen:~# zpool status pool_data pool: pool_data state: DEGRADED status: One or more devices is currently being resilvered. The pool will continue to function, possibly in a degraded state. action: Wait for the resilver to complete. scan: resilver in progress since Fri Jun 25 01:51:56 2021 3.63T scanned at 340M/s, 3.59T issued at 336M/s, 3.63T total 364G resilvered, 98.79% done, 0 days 00:02:17 to go config: NAME STATE READ WRITE CKSUM pool_data DEGRADED 0 0 0 raidz2-0 DEGRADED 0 0 0 spare-0 DEGRADED 0 0 0 replacing-0 DEGRADED 0 0 0 old OFFLINE 8 591 0 slot4 ONLINE 0 0 0 (resilvering) slot14 ONLINE 0 0 0 slot5 ONLINE 0 0 0 slot6 ONLINE 0 0 0 slot7 ONLINE 0 0 0 slot8 ONLINE 0 0 0 slot9 ONLINE 0 0 0 slot10 FAULTED 19 4 0 too many errors slot11 ONLINE 0 0 0 slot12 ONLINE 0 0 0 slot13 ONLINE 0 0 0 spares slot14 INUSE currently in use
infrastruktur/rz/storage-server/raid-rebuild.txt · Zuletzt geändert: 2022-12-02 20:17 von are