====== raid-rebuild ======
{{tag> storage-server infrastructure shackoperations }}
====== Versionen ======
| Version | Bearbeiter | Änderungsdatum | Änderungsbemerkung |
| 0.1 | hase | 25-06-2021 | Seite angelegt |
====== Raid Rebuild auf Naproxen ======
===== Zuordnung Platte zu Device im OS =====
Die Slots in dem Plattenrahmen unterhalb des Servers sind von links beginnend von 0 bis 14 durchnummeriert. Dies kommt 1:1 aufgrund diesem udev Zusatz [[https://git.shackspace.de/rz/udev-sas-enclosure|Shackspace Git udev sas enclosure]] auch im OS an.
Beispiel:
Slot4 ist defekt. Dann ist es im Plattenrahmen die Platte 5 (0->1->2->3->4) von links.
===== 1. Welche Platte ist defekt? =====
//zpool status//
root@naproxen:~# zpool status
pool: pool_data
state: DEGRADED
status: One or more devices is currently being resilvered. The pool will
continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
scan: resilver in progress since Fri Jun 25 01:51:56 2021
3.63T scanned at 582M/s, 2.24T issued at 359M/s, 3.63T total
227G resilvered, 61.75% done, 0 days 01:07:35 to go
config:
NAME STATE READ WRITE CKSUM
pool_data DEGRADED 0 0 0
raidz2-0 DEGRADED 0 0 0
spare-0 DEGRADED 0 0 0
replacing-0 DEGRADED 0 0 0
old OFFLINE 8 591 0
slot4 ONLINE 0 0 0 (resilvering)
slot14 ONLINE 0 0 0
slot5 ONLINE 0 0 0
slot6 ONLINE 0 0 0
slot7 ONLINE 0 0 0
slot8 ONLINE 0 0 0
slot9 ONLINE 0 0 0
slot10 FAULTED 19 4 0 too many errors <<<--- die ist kaputt
slot11 ONLINE 0 0 0
slot12 ONLINE 0 0 0
slot13 ONLINE 0 0 0
spares
slot14 INUSE currently in use
===== 2. Platte offline schalten =====
zpool offline pool_data /dev/mapper/slot4
===== 3. LUKS Container stoppen =====
cryptdisks_stop slot4
===== 4. Platte tauschen =====
Bitte jetzt die Platte rausziehen und austauschen.
===== 5. Device Name von neuer Platte finden =====
dmesg | tail -n 20
Finde den sdx Namen
===== 6. Platte mit LUKS formatieren =====
cryptsetup luksFormat /dev/disk/by-slot/4 --key-file ~/.luks/slot4
Die Slotnummer und den Namen des Keyfiles bitte anpassen!
===== 7. LUKS öffnen =====
cryptsetup luksOpen /dev/disk/by-slot/4 slot4 --key-file ~/.luks/slot4
^-- Platte ^-- LUKS Name (siehe /dev/mapper/slotx)
===== 8. "Tausche" in ZFS die Platte aus =====
zpool replace pool_data /dev/mapper/slot4
Danach wird die Platte aufgenommen und ein Resilver des Raids.
===== 9. Prüfe den Resilver-Status =====
watch -n 1 zpool status pool_data
root@naproxen:~# zpool status pool_data
pool: pool_data
state: DEGRADED
status: One or more devices is currently being resilvered. The pool will
continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
scan: resilver in progress since Fri Jun 25 01:51:56 2021
3.63T scanned at 340M/s, 3.59T issued at 336M/s, 3.63T total
364G resilvered, 98.79% done, 0 days 00:02:17 to go
config:
NAME STATE READ WRITE CKSUM
pool_data DEGRADED 0 0 0
raidz2-0 DEGRADED 0 0 0
spare-0 DEGRADED 0 0 0
replacing-0 DEGRADED 0 0 0
old OFFLINE 8 591 0
slot4 ONLINE 0 0 0 (resilvering)
slot14 ONLINE 0 0 0
slot5 ONLINE 0 0 0
slot6 ONLINE 0 0 0
slot7 ONLINE 0 0 0
slot8 ONLINE 0 0 0
slot9 ONLINE 0 0 0
slot10 FAULTED 19 4 0 too many errors
slot11 ONLINE 0 0 0
slot12 ONLINE 0 0 0
slot13 ONLINE 0 0 0
spares
slot14 INUSE currently in use