Server stürzt regelmäßig im Urlaub ab

Begonnen von elDudereeno, 06 Januar 2018, 13:06:23

Vorheriges Thema - Nächstes Thema

Damu

ZitatNach einer Stromunterbrechung kommt ein PI eigentlich wieder .. wenn das Dateisystem es überlebt hat.
Gibt es irgend etwas das man bei der Installation machen kann, damit das Dateysistem es eher überlebt?
Zum Beispiel eine ip Kamera hat damit in der Regel keine Probleme.

Wernieman

Ich habe, trotz mehrfacher Stromausfälle durch "Problem-FI" bisher keine Probleme mit dem PI gehabt. Andere dagegen schon.

Du könntest probieren, möglichst wenig auf die SD-Karte zu schreiben ... bei mir ist der PI nur nackt als "Befehlsempfänger" und Cron-Daten-Sammler beschäftigt, also nicht FHEM, schreibt also relativ wenig.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

darkness

Zitat von: elDudereeno am 06 Januar 2018, 13:06:23
Das ganze passiert immer im Winterurlaub, und manchmal auch unter-jährig. Insgesamt ca. 3 mal im Jahr.

Passiert denn im System was "besonderes" wenn das System in den Urlaubsmodus wechselt? Etwas was im "normalen" Betrieb nicht stattfindet?
Denke gerade an Heizung herunter fahren oder so. Wenn du diese Schritte manuell wiederholst, kann dann der Fehler reproduziert werden?

Wenn das System immer abstürzt wenn du im Urlaub bist, ist es ja mehr als ein Zufall.

Damu

Ich hab einen Pi3 mit HM_Uart und da maximal 20 Devices angemeldet.
Hatte noch keinen Ausfall, das möchte ich aber eben auch verhindern.
Wie gross muss die Speicherkarte für das PI3 sein wenn nur FHEM an Board ist?
Vielleicht lohnt sich da ein Speicher von Swissbit (SLC Speicher hat mir Mobotix empfolen für die T25 und C25, sollen extrem ausfallsicher sein).

Was ich speziel mache wenn SSD oder ähnlich eingebaut ist, ich lösche keine Daten, (log etc vom PI und Nuc).
Ob es hilft weiss ich natürlich nicht.

Wernieman

Warum soll das löschen von Daten bei einer SSD diese gefährden? Im Gegenteil: Seit es fstrim gibt, wird einer Verlangsamung verhindert.

Natürlich nur bei SSD (also nicht bei SD-Card)
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Damu

Beim Nuc hab ich eine 120GB Festplatte.
Da ist nur Ubuntu und eben FHEM mit seinen Log Dateien drauf.
Ich will damit verhindern das immer auf die gleichen Bits geschrieben wird.
Die SSD sind da schon einige Jahre alt.
Habe gelesen das es neue SSD gibt, die einen SLC Modus haben.
Erst wenn dieser Speicher voll ist wird im normalen Modus weitergeschrieben

Wernieman

Wenn Du ein aktuelles Ubuntu hast (16.04), wird die Platte automatisch 1 mal die Woche "getrimmt", wenn es eine SDD ist.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Tobias

Bein cubietruck hatte auch immer mal wieder unerklärliche abstürze.
Seitdem ich das im Igor Image standardmäßig aktivierte overclocking deaktiviert hatte, rennt er ohne Probleme durch. Ist heute seit 411 Tagen online :)

Gesendet von meinem Leap mit Tapatalk

Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

bugster_de

Auch wenn das ganze hier schon älter ist:

Ich habe ebenfalls unerklärliche Abstürze von FHEM, wenn wir in den Urlaub fahren. Und wirklich nur dann! Ich sage mal wir sind gefühlt 10 km von zu Hause weg und FHEM stürzt ab. In den Logfiles finde ich nichts relevantes, da sind stellenweise die letzten Log-Einträge zwei Stunden vor dem Absturz und dann endet es einfach.
Meine Vermutung war schon, ob es damit zusammenhängen kann dass beide Handy (das meiner Frau und meines) gleichzeitig abwesend gehen die Ursache sind. Aber dann würde der Effekt auch mal auftreten, wenn wir abends einfach nur zusammen das Haus verlassen um was essen zu gehen. Da passiert es aber auch nicht. Und in Summe ist das super ärgerlich, da ich ja gerade wenn ich nicht zu Hause bin ich mich auf FHEM verlassen möchte, damit Rolladen wie gewünscht auf- und zu gehen, die Lichtsteuerung eine Anwesenheit simuliert und der Garten gegossen wird.

Ich nutze einen Raspberry Pi3 und hatte schon zweimal den Effekt, dass ein harter Reboot durch Stromweg die SD Karte gekillt hat. Somit ist für den Urlaubs-Crash leider keine zuverlässige Lösung, dass die nette Nachbarin mal rüber geht und den Pi vom Strom trennt.
Ich habe deshalb eine RAM Disk angelegt, in der FHEM seine verschiedenen Log-Files und save Dateien speichert, womit dann die Speicherbelastung der SD deutlich zurück geht. Die Logs werden per Cronjob in regelmässigen Abständen auf meinen Server kopiert und beim wieder hochbooten dann zurück in die RAM-Disk kopiert. Das läuft nun zwar seit 1,5 Jahren so, aber die Abstürze im Urlaub bleiben.

Vor einigen Jahren hatte ich auch einen Banana-Pi als FHEM Server im Einsatz. Der war eine Katastrophe, da er bei Rechenlast extrem heiß wurde und dann ausging. Süprich wenn FHEM mal was Rechenintensives gemacht hat, war er innert Sekunden glühend heiß und schaltete sich aus. Bin dann wieder auf den Pi zurück.

Für die Urlaubsabstürze habe ich jedenfalls keine Lösung gefunden und bin für Tips dankbar, wie man das einkreisen kann.

Wernieman

Steht was in den Linux-Logs? (kern.log syslog etc.)

Vielleicht will der Pi auch nur Urlaub machen, wenn "Herrchen" Urlaub macht ....

Der Nachteil von Logs im RAM: Bei einem Absturz sind die Weg und damit ALLE Debugmöchlichkeiten. Die Frage deshalb her: Was hast Du für einen Server, bzw. kann der als Log-Server herhalten?
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

hexenmeister

Wenn Logs nichts hergeben, bleibt nur die Geräte nach und nach zu deaktivieren, bis man den Übeltäter gefunden hat. Anfangen würde ich natürlich mit der Abwesenheits-Logik.
Um Symptome abzumildern, würde zumindest ich sicherstellen, dass FHEM nach einem Absturz sofort wieder neustartet. Mit Systemd in den neueren Linux-Versionen ist das leicht zu erledigen.

Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Wernieman

bzw: Die Frage ist auch:
FHEM Absturz oder System-Absturz?

Gibt es eigene Regeln für den Urlaub? Eventuell dort suchen?
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html