Hallo,
ich habe seit einigen Tagen häufiger einen Ausfall den Fhem. Das merke ich aber erst abends und habe so unter Tage keine Strommessdaten bzw. Ausfall der Haussteuerung.
Ich starte dann einfach direkt auf der RPI den Fenstern Fhem wieder und es klappt für die nächsten Stunden.
Im log steht nichts dazu. Update ist gemacht.
Da ich gerade keine Zeit für weitere/tiefere Ursachenforschung habe -nachfolgende Frage:
Hat jemand für mich eine Idee bzw. Direkt den Cronjob der z.B stündlich nachschaut, ob fhem noch läuft und dann ggf. automatisch fhem wieder atartet.
Danke für die Hilfe
Jörg
Das folgende Skript unter /root/scripts anlegen
#!/bin/sh
result=$(ps -ef | grep fhem.pl | egrep -v grep|wc -l)
if [ $result -gt 0 ]
then
echo "+++ Fhem is up and running -> OK! +++" >&1
else
echo "--- fhem is down ($result) ---" >&2
/etc/init.d/fhem start
fi
Aufgerufen in der root-Crontab wie folgt:
# Pruefen ob FHEM laeuft
*/6 * * * * /root/scripts/check_fhem.sh 1>/dev/null
Ganz vielen Dank.
Wenige Minuten Implementierung und riesen Wirkung.
Das sollte eigentlich auch ins Wiki !??
Jörg
Zitat von: jnewton957 am 28 April 2017, 07:40:04
Das sollte eigentlich auch ins Wiki !??
Nein, denn das ist keine adäquate Problemlösung.
Es sollten lieber die Ursachen ergründet und der/die Fehler beseitigt werden.
Ein Linux Host sollte nur neu gestartet werden wenn es wirklich nötig ist (z.B. Kernel Update).
Gruß
Dan
Zitat von: DeeSPe am 28 April 2017, 07:45:17
Nein, denn das ist keine adäquate Problemlösung.
Es sollten lieber die Ursachen ergründet und der/die Fehler beseitigt werden.
Ein Linux Host sollte nur neu gestartet werden wenn es wirklich nötig ist (z.B. Kernel Update).
Gruß
Dan
Da gebe ich dir natürlich Recht. Ds ist kein "Allheilmittel". Aber eben genau mit DEINEM Hinweis könnte man es ja eintragen.
Zitat von: DeeSPe am 28 April 2017, 07:45:17
Nein, denn das ist keine adäquate Problemlösung.
Es sollten lieber die Ursachen ergründet und der/die Fehler beseitigt werden.
Ein Linux Host sollte nur neu gestartet werden wenn es wirklich nötig ist (z.B. Kernel Update).
Gruß
Dan
Klar, Ursachenforschung sollte natürlich getrieben werden. Da gibt Dir jeder Recht.
Aber das Script startet doch "nur" den Dienst neu...
Das Script funktioniert nicht wenn FHEM hängt aber der Prozess dennoch in der Prozesstabelle steht. Zu mindest ein Test auf Zombi hätte man noch machen können.
Besser wäre ein versuchter telnet Aufruf auf 7072 und diesen auswerten. Das kann man mit einem kleinen Perlscript machen ;D
Zweite Variante. Hier im Forum nach watchdog suchen in Verbindung mit betateilchen. Udo lässt alle eine Minute über FHEM at eine Datei schreiben und wertet den Zeitstempel mit einem watchdog Programm aus. Ist der Zeitstempel zu alt wird das system neu gestartet.
Trotzdem sollte FHEM nicht einfach "weg" sein.
Außerdem würde ich das starten von FHEM mitloggen, Ohne Logfile ist ein Debugging nicht möglich.
NUr folgenden Satz verstehe ich aktuell nicht
ZitatRPI den Fenstern Fhem
Ich hatte das gleiche Problem, mit FHEM.
Zuerst auf einem RasPi, wo ich dachte, es läge an der SD-Karte. Doch tauchte es auch in meiner neuen VM nach ca. 2 Wochen auf. Ich habe zwei FHEM Instanzen per FHEM2FHEM verbunden (Hausserver zu Energieserver). Zudem hatte ich eine Überwachung drin, falls diese Verbindung Mal wegbrechen sollte.
Als das FHEM Problem nun wieder auftauchte, habe ich diese Überwachung wieder gelöscht und auch ein paar alte Logs auf dem betroffenen System gelöscht. Und seit dem läuft alles wieder stabil. Obwohl ein Konsolenaufruf zur Speicherstadting unauffälliges zeigte.
Vielleicht hilft es dir ja.
VG
André