Software-RAID defekt. Wie reparieren ?

Begonnen von Bartimaus, 27 November 2017, 10:00:41

Vorheriges Thema - Nächstes Thema

Bartimaus

MoinMoin,

brauche mal eine Tip von Linux-Profis....

Ich habe einen QNAP-Server mit 4 HDDs im RAID5.
Eine Platte war ausgefallen, ersetzt, rebuild, alles ok.

Dann dachte ich, mehr Ausfallsicherheit kann nicht schaden, also weitere Platte eingebaut und versucht, von RAID5 auf RAID6 zu migrieren. (Alles via Webinterface)
Das ist allerdings fehlgeschlagen, das RAID6(? lt. webif) ist nicht mehr aktiv, und lässt sich über das Webinterace auch nicht wiederherstellen: Fehlermeldung: ERR_GENERIC

Jetzt die Frage an die Profis: Kann man das Software-RAID mit "mdadm" nicht via Konsole wiederherstellen ?

Backup liegt fast vollständig vor, dennoch wäre mir eine Wiederherstellung lieber.

Ideen ?
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

Da dürfte Migration  Raid5->6 schiefgelaufen sein. Reparatur ist damit eigentlich sinnlos. Besser: Neubau!

Warum allerdings 6 sicherer als 5 sein soll, ist mir ein Rätsel.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

Danke für Deine Antwort.

Ich denke auch, das die Migration der Kasus knacktus war.
Aber echt jetzt ?  :'( :'(

Das System lief bis zum Einbau der Ersatzplatte im Degraded-Modus, ein Ausfall einer weiteren Platte wäre der Exitus gewesen.
Bei RAID6 können doch bis zu 2 Platten ausfallen ohne Datenverlust...
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

ZitatBei RAID6 können doch bis zu 2 Platten ausfallen ohne Datenverlust...

Teoretisch sollte 6 mehr Plattenverlust überstehe können als 5. Praktisch .. da es keine "definierte" Spezifikation für 6 gibt ... außerdem ist ein "gutes" 6 langsamer als ein 5.

Das Problem bei RAID5 ist die massige Beanspruchung der Platten beim Rebuild. In der Zeit ist ein Ausfall mit größerer Wahrscheinlichkeit gegeben.

Wenn Dir der "bestand" so wichtig ist, wäre eine "HotSpare" interessanter gewesen. Mir persönlich würde aber ein gutes Backup wichtiger sein.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

Hm. Performance ist nicht so wichtig.
Hotspare kenne ich nicht. Kannst Du mir das mit einfachen Worten erklären ? ::)
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

Er hält eine Platte in Reserve. Wenn eine der anderen Kaput geht, wird diese automatisch dafür verwenden (Rebuild).
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

Habe gerade noch mit Kollegen gesprochen: Empfehlung ist generell: Neubau des Raid-Systemes.

Selbst wenn Du bei 6 bleiben möchtest ... was ich Dir (aus persönlichen Gründen) nicht empfehlen würde.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

Um den Neubau komme ich wahrscheinlich nicht herum.
Hotspare bietet QNAP auch an, ziehe ich dann in Betracht.
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

Btw:
Gut wäre auch, regelmäßige smart-Prüfungen. ist zwar nicht 100% Ganratiert, aber man bekommt meistens relativ früh mit, das eine Platte ausfallen wird.

Hat mir "damals" bei meinem Linux-Server über 5 Jahre 2x das System gerettet (da kein RAID  ::) )
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

Das macht das OS von QNAP. Ich bekam eine Mail über defekte Blöcke auf einer HDD, worauf die betreffende Platte ASAP getauscht wurde. Während der Zeit habe ich halt etwas geschwitzt, was ich künftig vermeiden möchte.

Die Platten sind NAS-zertifizierte WD-Purple, die Platte hat keine 24 Monate gehalten (22).
Server läuft 24/7
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

Also reklamieren .. gibt relativ zuverlässig neue.

Entweder halten die Platten  kurz (egal welcher Hersteller) oder ziemlich lange ....
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

Schon erledigt. Händler hat 2 Jahre, Hersteller 3 Jahre
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Bartimaus

Hi,

nochmal ne Frage zum Hotspare:

Also RAID5 mit 4HDDs+1Hotspare.
Jetzt fällt eine HDD aus dem RAID aus, dann wirft das OS die defekte Platte raus, und die HOTspare wird zum rebuild des RAID genutzt. Korrekt ?
Angenommen jetzt fällt währenddessen eine weitere Platte aus, sind die Daten dann noch da ? Steh da gerade auf dem Schlauch. Beim RAID6 wäre dem so...
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

ChristianH

#14
Zitat von: Wernieman am 27 November 2017, 11:05:26
Habe gerade noch mit Kollegen gesprochen: Empfehlung ist generell: Neubau des Raid-Systemes.

Selbst wenn Du bei 6 bleiben möchtest ... was ich Dir (aus persönlichen Gründen) nicht empfehlen würde.
Was ein Schwachsinn, im industriellen Umfeld wird RAID6 heute als Standard angesehen und bei grossen Platten sogar über RAID 7 nachgedacht (drei parity und x Datenplatten)

das RAID6 schützt vor weiteren Fehlern während des Rebuilds und vor bit-rot. Wer sich das vom Platz her leisten kann sollte das tun.

Zur hot spare: die Macht nur Sinn, wenn es mehrere raids gibt, in welche es als Ersatz einspringen kann. Gibt es aber nur ein raid (wovon ich hier ausgehe), wo soll hier der Sinn sein. Eine hot spare muss bei einem Plattenausfall erst mit Daten betankt werden (also viel rechnen und viel io), eine RAID6 parity Platte hat bereits die Daten.

lesen bildet....

zu der aktuellen Situation: RAID5 (drei Datenplatten, eine parity Platte) zu RAID6 (2Daten, 2Parity) bei einem 4Bay System, wie soll das gehen? Daten schrumpfen?   

Wundert mich eher, dass das System das anbietet.

lesen bildet....

Gesendet von meinem Nexus 7 mit Tapatalk

Bartimaus

Von einem 4bay war nie die Rede.... 8)

Es ist ein 6Bay, bei dem bisher erst 4 Plätze belegt waren....
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

@ChristianH
Es ist ein Unterschied, ob Du ein RAID6 auf ein Sauteuren RAID-Controller oder auf eine "billige"-Storage-Lösung baust.

Siehe Doku
@ChristianH Genau für Dich: Lesen Bildet!

Im Profifeld wird sogar über 10 geredet .. da häufig 5,6 etc. zu langsam  ....
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

pjakobs

#17
RAID6 hat einen großen Vorteil: wenn eine Platte im Verbund ausfällt bleibt der Rest immer noch ein redundantes RAID5. Das gibt erstens ein bisschen Gelassenheit, bis die neue Platte da und eingebaut ist, und zweitens, wichtiger: während des RAID rebuild werden alle Platten extrem belastet (alle Blöcke müssen gelesen werden, bei nicht Platten werden pro Platte 1/n Blöcke geschrieben), wenn eine weitere Platte Probleme hat, dann ist die Wahrscheinlichkeit hoch, dass sie genau jetzt ausfällt. Ein RAID5 ist während des rebuild degraded, bis das Raidset wieder komplett ist, RAID6 kann während des rebuild den Ausfall einer Platte ohne Datenverlust verkraften.

Mein primärer storage hier läuft seit Jahren mit einem 5*3TB RAID6, vorher waren es 5*1TB. RAID6 hatte hier den Vorteil, dass ich die Platte einzeln ersetzen konnte, ohne jemals mit einem degraded RAID leben zu müssen.

Zu QNAP: deren RAID ist zwar irgendwie ein mdraid, aber irgendwie auch nicht. Ich hatte ein paar Mal das Problem, dass eine der config Dateien abgeschnitten wurde. Ich weiß aber beim besten Willen nicht mehr, welche. Üblicherweise lassen sich aber viele Probleme beheben und das qnap Forum ist sehr hilfreich.

Grüße

pj

Kurz da auf dem Telefon getippt

ChristianH

Zitat von: Wernieman am 28 November 2017, 08:44:06
@ChristianH
Es ist ein Unterschied, ob Du ein RAID6 auf ein Sauteuren RAID-Controller oder auf eine "billige"-Storage-Lösung baust.

Siehe Doku
@ChristianH Genau für Dich: Lesen Bildet!

Im Profifeld wird sogar über 10 geredet .. da häufig 5,6 etc. zu langsam  ....
Mmm, ich habe über performance gar nicht gesprochen... RAID10 ist übrigens auch keine gute Idee, eher ein RAID01. Mach dir mal keine Sorgen, ich kenne dem Unterschied zwischen billig und teuer, ich arbeite für einen teuren Anbieter (und kann mir unser eigenes Produkt nicht leisten)

Gruss Christian

Gesendet von meinem ONEPLUS A3003 mit Tapatalk