FHEM Absturz ausgerechnet im Urlaub

Begonnen von Marlen, 29 September 2017, 21:23:32

Vorheriges Thema - Nächstes Thema

Marlen

Hallo,

da dachte ich das ich mein FHEM jetzt endlich im Griff habe und auch die Systemauslastung ziemlich heruntergefahren habe und dann is man mal im Urlaub und am 3. Tag ist es nicht mehr erreichbar!  >:(
Dachte schon mein Haus is abgebrannt.

Bin heute wieder heim gekommen und das Haus war noch da!  ;D Habe dann einen restart gemacht, dann lief es wieder.
Die letzten log-Einträge waren:
2017.09.27 16:46:08 1: Cannot fork: Cannot allocate memory
2017.09.27 16:46:09 2: PRESENCE (FosCam_Ping) - error while processing check: Could not execute ping command: "ping -c 4 192.168.178.37"
2017.09.27 16:48:19 2: PRESENCE (FosCam_Ping) - error while processing check: Could not execute ping command: "ping -c 4 192.168.178.37"
2017.09.27 16:52:12 2: PRESENCE (DBLinkCam_Ping) - error while processing check: Could not execute ping command: "ping -c 4 192.168.178.28"
Sys::Statistics::Linux::DiskUsage: unable to execute 'df -kP 2>/dev/null' (Cannot allocate memory) at ./FHEM/32_SYSSTAT.pm line 322.
2017.09.27 16:54:09 1: BlockingInformParent (BlockingStart): Can't connect to localhost:43933: IO::Socket::INET: connect: Connection refused
2017.09.27 16:54:09 1: BlockingInformParent (PRESENCE_ProcessLocalScan): Can't connect to localhost:43933: IO::Socket::INET: connect: Connection refused


Weiß nicht ob diese Einträge einen Absturz herbei geführt haben, oder ob ein Stromausfall etc. war.

Wie kann ich das jetzt abstellen? Kann man in Perl irgendwie FHEM überwachen, ob es noch läuft und ggf. neu starten?

LG
  Marlen

Fixel2012

Zitat von: Marlen am 29 September 2017, 21:23:32
Kann man in Perl irgendwie FHEM überwachen, ob es noch läuft und ggf. neu starten?

Gib mal das Stichwort Watchdog in der Forensuche ein, hatte da mal einige Threads gesehen :)
Fhem 5.8 auf Raspi 3, HMLAN und 868MHz CUL mit einigen Komponenten, Z-Wave Rollladenaktoren, Tablet UI, 433 MHz CUL mit Baumarktsteckdosen und Temp Sensoren, Amazon Echo, Echo Dot, 2x SONOS  play1, 1x SONOS Connect AMP,  presence, HUE, Lightify

fiedel

#2
Ging mir auch schon mal so. Am nächsten Tag lief es wieder, weil es nur ein Internetausfall war. Seit dem überwache ich per "Presence / lan-ping" den Google DNS- Server (Internet o.k.) und die ungepufferte Fritzbox (Stromausfall) und sende mir vom USV- gepufferten FHEM- Server eine SMS mit der jeweiligen Kommunikationsausfallursache. Fällt der Strom länger aus, läuft die Mini- USV leer und startet bei Spannungswiederkehr den Server neu. FHEM selbst überwache ich noch nicht, aber das ist angedacht. Z.B. damit. Oder so.
FeatureLevel: 6.1 auf Wyse N03D ; Deb. 11 ; Perl: v5.14.2 ; IO: HM-MOD-RPI-PCB + VCCU|CUL 868 V 1.66|LinkUSBi |TEK603
HM: SEC-SCO|SCI-3-FM|LC-SW4-PCB|ES-PMSW1-PL|RC-4-2|SEN-MDIR-O|SEC-WDS-2
CUL: HMS100TF|FS20 S4A-2 ; OWDevice: DS18S20|DS2401|DS2406|DS2423

stefan-dd

Ich habe auf meinem FHEM Pi noch DoorPi laufen. Wenn Fhem mal abstürzen sollte, läuft der Pi ja noch weiter. In dem Fall kann ich Door Pi von extern über die DoorPi eigene Rufnummer anrufen und über eine Tastenkombination, die ein Script ausführt, neu starten lassen. Zugelassen sind nur vorher festgelegt Rufnummern, die Sicherheit ist also gegeben..
Funktioniert super!

micky0867

#4
Zitat von: Marlen am 29 September 2017, 21:23:32
Hallo,

da dachte ich das ich mein FHEM jetzt endlich im Griff habe und auch die Systemauslastung ziemlich heruntergefahren habe und dann is man mal im Urlaub und am 3. Tag ist es nicht mehr erreichbar!  >:(
Dachte schon mein Haus is abgebrannt.

Bin heute wieder heim gekommen und das Haus war noch da!  ;D Habe dann einen restart gemacht, dann lief es wieder.
Die letzten log-Einträge waren:
2017.09.27 16:46:08 1: Cannot fork: Cannot allocate memory
2017.09.27 16:46:09 2: PRESENCE (FosCam_Ping) - error while processing check: Could not execute ping command: "ping -c 4 192.168.178.37"
2017.09.27 16:48:19 2: PRESENCE (FosCam_Ping) - error while processing check: Could not execute ping command: "ping -c 4 192.168.178.37"
2017.09.27 16:52:12 2: PRESENCE (DBLinkCam_Ping) - error while processing check: Could not execute ping command: "ping -c 4 192.168.178.28"
Sys::Statistics::Linux::DiskUsage: unable to execute 'df -kP 2>/dev/null' (Cannot allocate memory) at ./FHEM/32_SYSSTAT.pm line 322.
2017.09.27 16:54:09 1: BlockingInformParent (BlockingStart): Can't connect to localhost:43933: IO::Socket::INET: connect: Connection refused
2017.09.27 16:54:09 1: BlockingInformParent (PRESENCE_ProcessLocalScan): Can't connect to localhost:43933: IO::Socket::INET: connect: Connection refused


Weiß nicht ob diese Einträge einen Absturz herbei geführt haben, oder ob ein Stromausfall etc. war.

Wie kann ich das jetzt abstellen? Kann man in Perl irgendwie FHEM überwachen, ob es noch läuft und ggf. neu starten?

LG
  Marlen
Das "cannot fork" ist ein Folgefehler.
Irgendwas hat geklemmt und den Speicher zugemüllt (out of memory).
Da bleibt nur: System beobachten und schauen, ob sich da wieder was anbahnt.
Hattest du die Cams auch neu gestartet?
Hast du dir das Log des Betriebssystems auch mal angesehen?

Gesendet von meinem ONEPLUS A3003 mit Tapatalk


Marlen

ZitatHast du dir das Log des Betriebssystems auch mal angesehen?

Wie kann ich das anschauen?

Fixel2012

Fhem 5.8 auf Raspi 3, HMLAN und 868MHz CUL mit einigen Komponenten, Z-Wave Rollladenaktoren, Tablet UI, 433 MHz CUL mit Baumarktsteckdosen und Temp Sensoren, Amazon Echo, Echo Dot, 2x SONOS  play1, 1x SONOS Connect AMP,  presence, HUE, Lightify