====== raid-rebuild ====== {{tag> storage-server infrastructure shackoperations }} ====== Versionen ====== | Version | Bearbeiter | Änderungsdatum | Änderungsbemerkung | | 0.1 | hase | 25-06-2021 | Seite angelegt | ====== Raid Rebuild auf Naproxen ====== ===== Zuordnung Platte zu Device im OS ===== Die Slots in dem Plattenrahmen unterhalb des Servers sind von links beginnend von 0 bis 14 durchnummeriert. Dies kommt 1:1 aufgrund diesem udev Zusatz [[https://git.shackspace.de/rz/udev-sas-enclosure|Shackspace Git udev sas enclosure]] auch im OS an. Beispiel: Slot4 ist defekt. Dann ist es im Plattenrahmen die Platte 5 (0->1->2->3->4) von links. ===== 1. Welche Platte ist defekt? ===== //zpool status// root@naproxen:~# zpool status pool: pool_data state: DEGRADED status: One or more devices is currently being resilvered. The pool will continue to function, possibly in a degraded state. action: Wait for the resilver to complete. scan: resilver in progress since Fri Jun 25 01:51:56 2021 3.63T scanned at 582M/s, 2.24T issued at 359M/s, 3.63T total 227G resilvered, 61.75% done, 0 days 01:07:35 to go config: NAME STATE READ WRITE CKSUM pool_data DEGRADED 0 0 0 raidz2-0 DEGRADED 0 0 0 spare-0 DEGRADED 0 0 0 replacing-0 DEGRADED 0 0 0 old OFFLINE 8 591 0 slot4 ONLINE 0 0 0 (resilvering) slot14 ONLINE 0 0 0 slot5 ONLINE 0 0 0 slot6 ONLINE 0 0 0 slot7 ONLINE 0 0 0 slot8 ONLINE 0 0 0 slot9 ONLINE 0 0 0 slot10 FAULTED 19 4 0 too many errors <<<--- die ist kaputt slot11 ONLINE 0 0 0 slot12 ONLINE 0 0 0 slot13 ONLINE 0 0 0 spares slot14 INUSE currently in use ===== 2. Platte offline schalten ===== zpool offline pool_data /dev/mapper/slot4 ===== 3. LUKS Container stoppen ===== cryptdisks_stop slot4 ===== 4. Platte tauschen ===== Bitte jetzt die Platte rausziehen und austauschen. ===== 5. Device Name von neuer Platte finden ===== dmesg | tail -n 20 Finde den sdx Namen ===== 6. Platte mit LUKS formatieren ===== cryptsetup luksFormat /dev/disk/by-slot/4 --key-file ~/.luks/slot4 Die Slotnummer und den Namen des Keyfiles bitte anpassen! ===== 7. LUKS öffnen ===== cryptsetup luksOpen /dev/disk/by-slot/4 slot4 --key-file ~/.luks/slot4 ^-- Platte ^-- LUKS Name (siehe /dev/mapper/slotx) ===== 8. "Tausche" in ZFS die Platte aus ===== zpool replace pool_data /dev/mapper/slot4 Danach wird die Platte aufgenommen und ein Resilver des Raids. ===== 9. Prüfe den Resilver-Status ===== watch -n 1 zpool status pool_data root@naproxen:~# zpool status pool_data pool: pool_data state: DEGRADED status: One or more devices is currently being resilvered. The pool will continue to function, possibly in a degraded state. action: Wait for the resilver to complete. scan: resilver in progress since Fri Jun 25 01:51:56 2021 3.63T scanned at 340M/s, 3.59T issued at 336M/s, 3.63T total 364G resilvered, 98.79% done, 0 days 00:02:17 to go config: NAME STATE READ WRITE CKSUM pool_data DEGRADED 0 0 0 raidz2-0 DEGRADED 0 0 0 spare-0 DEGRADED 0 0 0 replacing-0 DEGRADED 0 0 0 old OFFLINE 8 591 0 slot4 ONLINE 0 0 0 (resilvering) slot14 ONLINE 0 0 0 slot5 ONLINE 0 0 0 slot6 ONLINE 0 0 0 slot7 ONLINE 0 0 0 slot8 ONLINE 0 0 0 slot9 ONLINE 0 0 0 slot10 FAULTED 19 4 0 too many errors slot11 ONLINE 0 0 0 slot12 ONLINE 0 0 0 slot13 ONLINE 0 0 0 spares slot14 INUSE currently in use