Benutzer-Werkzeuge

Webseiten-Werkzeuge


infrastruktur:rz:storage-server:raid-rebuild

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
infrastruktur:rz:storage-server:raid-rebuild [2021-06-25 03:45] haseinfrastruktur:rz:storage-server:raid-rebuild [2022-12-02 20:17] (aktuell) – [9. Prüfe den Resilver-Status] are
Zeile 7: Zeile 7:
  
 ====== Raid Rebuild auf Naproxen ====== ====== Raid Rebuild auf Naproxen ======
-===== Welche Platte ist defekt? ===== +===== Zuordnung Platte zu Device im OS ===== 
-zpool status+Die Slots in dem Plattenrahmen unterhalb des Servers sind von links beginnend von 0 bis 14 durchnummeriert. Dies kommt 1:1 aufgrund diesem udev Zusatz [[https://git.shackspace.de/rz/udev-sas-enclosure|Shackspace Git udev sas enclosure]] auch im OS an. 
 + 
 +Beispiel: 
 +Slot4 ist defekt. Dann ist es im Plattenrahmen die Platte 5 (0->1->2->3->4) von links. 
 + 
 +===== 1. Welche Platte ist defekt? ===== 
 +//zpool status//
  
 <code> <code>
Zeile 43: Zeile 49:
 </code> </code>
  
 +===== 2. Platte offline schalten =====
 +<code>
 +zpool offline pool_data /dev/mapper/slot4
 +</code>
 +===== 3. LUKS Container stoppen =====
 +<code>
 +cryptdisks_stop slot4
 +</code>
  
 +===== 4. Platte tauschen =====
 +Bitte jetzt die Platte rausziehen und austauschen.
  
 +===== 5. Device Name von neuer Platte finden =====
 +<code>
 +dmesg | tail -n 20
 +</code>
  
 +Finde den sdx Namen
 +
 +===== 6. Platte mit LUKS formatieren =====
 +<code>
 +cryptsetup luksFormat /dev/disk/by-slot/4 --key-file ~/.luks/slot4
 +</code>
 +
 +Die Slotnummer und den Namen des Keyfiles bitte anpassen!
 +
 +===== 7. LUKS öffnen =====
 +<code>
 +cryptsetup luksOpen /dev/disk/by-slot/4 slot4 --key-file ~/.luks/slot4
 +
 +                       ^-- Platte        ^-- LUKS Name (siehe /dev/mapper/slotx)
 +</code>
 +
 +===== 8. "Tausche" in ZFS die Platte aus =====
 +<code>
 +zpool replace pool_data /dev/mapper/slot4
 +</code>
 +Danach wird die Platte aufgenommen und ein Resilver des Raids.
 +
 +===== 9. Prüfe den Resilver-Status =====
 +<code>watch -n 1 zpool status pool_data</code>
 +
 +<code>
 +root@naproxen:~# zpool status pool_data
 +  pool: pool_data
 + state: DEGRADED
 +status: One or more devices is currently being resilvered.  The pool will
 + continue to function, possibly in a degraded state.
 +action: Wait for the resilver to complete.
 +  scan: resilver in progress since Fri Jun 25 01:51:56 2021
 + 3.63T scanned at 340M/s, 3.59T issued at 336M/s, 3.63T total
 + 364G resilvered, 98.79% done, 0 days 00:02:17 to go
 +config:
 +
 + NAME               STATE     READ WRITE CKSUM
 + pool_data          DEGRADED             0
 +   raidz2-0         DEGRADED             0
 +     spare-0        DEGRADED             0
 +       replacing-0  DEGRADED             0
 +         old        OFFLINE      8   591     0
 +         slot4      ONLINE                (resilvering)
 +       slot14       ONLINE               0
 +     slot5          ONLINE               0
 +     slot6          ONLINE               0
 +     slot7          ONLINE               0
 +     slot8          ONLINE               0
 +     slot9          ONLINE               0
 +     slot10         FAULTED     19          too many errors
 +     slot11         ONLINE               0
 +     slot12         ONLINE               0
 +     slot13         ONLINE               0
 + spares
 +   slot14           INUSE     currently in use
 +</code>
  
infrastruktur/rz/storage-server/raid-rebuild.1624585528.txt.gz · Zuletzt geändert: 2021-06-25 03:45 von hase