Vermeidung Systemausfall durch SD-Kartenausfall

Begonnen von FhemPiUser, 18 Oktober 2020, 16:42:56

Vorheriges Thema - Nächstes Thema

FhemPiUser

#30
danke Rudolf, iostat habe ich gesucht!

Dieser Befehl monitored die geschriebene Bytes auf die SD-Karte:


sudo apt-get install sysstat
watch -n1 sudo iostat -d -p mmcblk0


Merkwürdig ist allerdings, dass der Wert "kB_wrtn" alle paar Sekunden ansteigt.

Wenn die Ausgabe korrekt ist, scheint ja die commit=900-Option nichts zu bringen.

Es scheint aber nicht an dem fhem log zu liegen, da der Wert zu anderen Zeitpunkten ansteigt als auf die Log-Dateien zugegriffen wird (gemäß inotifywait-Ausgabe). Ich habe auch alle anderen Verzeichnisse (bis auf /proc und die tmpfs-Verzeichnise /dev, /run, /sys) per inotifywait überwacht und keine Dateizugriffe identifizieren können, die mit dem Anstiegszeitpunkten von "kB_wrtn" (gemäß iostat-Ausgabe) korrelieren.

Jemand eine Idee, warum das  "kB_wrtn" alle paar Sekunden ansteigt bzw. wie ich identifizerien kann, wer da offenbar ständig auf die SD-Karte schreibt?

Oder muss es da keine zeiliche Korrelation geben und es können auch die fhem log Dateizugriffe sein? In diesem Fall würde die commit=900-Option nichts bringen, da trotzdem aus irgendeinem Grund (welcher?) ständig syncs auf die SD-Karte stattfinden.

Wernieman

iostat merkt sich das schreiben, seit dem Booten, d.h. die Werte kbyte/s sind in Summe ...

Sonst gucke mal nach "/proc/diskstats".
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

MadMax-FHEM

Die Antwort auf "warum lässt sich zeitlich nichts zuordnen" könnte sein: cache ;)

Also das OS cashed erst mal und schreibt halt dann (irgendwann) mal...

Es macht ja Spaß hier zu lesen...
...allerdings bin ich nicht sicher, ob der ganze Aufwand der hier getrieben wird (mal abgesehen vom "sportlichen Ehrgeiz" ;)  ) lohnt...

Entweder regelmäßig die SD tauschen oder auf SSD umsteigen oder ein anderes richtig hoch verfügbares System nehmen...

Weil egal wie: es ist alles nur Wahrscheinlichkeit. Die kann man kleiner bekommen...

ABER: dass es trotzalledem einen (Total)Ausfall geben kann (und damit auch potentiell wird ;) ) kannst du nicht verhindern...
(und wie so oft im Leben kommt es genau dann, wenn man es am wenigsten brauchen kann)

Nur meine Meinung...

Gruß, Joachim
FHEM PI3B+ Bullseye: HM-CFG-USB, 40x HM, ZWave-USB, 13x ZWave, EnOcean-PI, 15x EnOcean, HUE/deCONZ, CO2, ESP-Multisensor, Shelly, alexa-fhem, ...
FHEM PI2 Buster: HM-CFG-USB, 25x HM, ZWave-USB, 4x ZWave, EnOcean-PI, 3x EnOcean, Shelly, ha-bridge, ...
FHEM PI3 Buster (Test)

FhemPiUser

#33
danke, /proc/diskstats zeigt genau wie iostats, dass es trotz commit=900 alle paar Sekunden Schreibzugriffe auf die SD-Karte gibt.

Ich habe daher die commit-Option wieder rausgenommen, weil bringt nichts.

Also gibt es wohl leider keine Optimierung der Lebensdauer der SD-Karte mit wenig Aufwand und es bleibt dabei: Regelmäßige Backups und SD-Karte tauschen in proaktiv längeren Intervallen oder natürlich reaktiv wenn kaputt.

Alternative wäre wie einige geschrieben haben Umstieg auf anderen Speicher bzw. hochverfügbares System, was ich aber erstmal nicht mache, da mein System seit >5 Jahre bisher nie aufgrund kaputter SD-Karte ausgefallen ist (ich glaube ich habe einmal in der Zeit die SD-Karte proaktiv getauscht).

Danke an alle für die vielen Hinweise und interesanten Diskussionen!

Wernieman

Zitat/proc/diskstats zeigt genau wie iostats, dass es trotz commit=900 alle paar Sekunden Schreibzugriffe auf die SD-Karte gibt.
Das dürfte dann auch durch folgendes gelöst werden:
echo '1500' >/proc/sys/vm/dirty_writeback_centisecs
echo '3000' >/proc/sys/vm/dirty_expire_centisecs
echo '50' >/proc/sys/vm/dirty_ratio
echo '20' >/proc/sys/vm/dirty_background_ratio


Es gibt eben nicht nur die "eine" Stelle, wo Du dran schrauben kannst.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html