OWX kann FHEM abschiessen ?!?

Begonnen von cwagner, 06 Dezember 2013, 23:30:41

Vorheriges Thema - Nächstes Thema

hexenmeister

#15
Hallo Manuel,

warum immer mal wieder eine 'server ddead' Meldung kommt, sieht man aus dem Plot ('grüne Säge'). Da, wo die Zacken Stufen haben, hatte Dein FHEM eine 'Gedenkpause' eingelegt. Scheint so, dass Du relativ heftige 'freezes' hast. Schau Dir den Log an, da müssten relativ lange Pausen zu finden sein, diese interpretiert Watchdog als Server-Ausfall. Das wäre kein Problem des Watchdogs, sondern in Deiner Installation zu suchen.
Installiere mal 99_perfmon.pm von hier http://forum.fhem.de/index.php/topic,16347.0.html und schaue Dir Logs an. Vielleicht kommst Du dann der Ursache näher.
Bis dahin kannst Du in watchdogloop.sh die Variable maxTime erhöhen, damit Watchdog Dein FHEM nicht zu früh killt.

Zu der leeren watchdog.log:
Die Meldungen generiert watchdogloop.sh in der Methode log() (Zeile 48). Dort wird der Dateiname zusamengesetzt (z.B: ./log/watchdog-2013-12.log) und die Meldungen geschrieben (echo "$currentTimeStr fhem_server $1" >> $log;):

2013-12-15_16:04:10 fhem_server V: 10 S: alive MSG: FHEM Server alive
2013-12-15_16:05:10 fhem_server V: 10 S: alive MSG: FHEM Server alive
2013-12-15_16:06:11 fhem_server V: 11 S: alive MSG: FHEM Server alive
2013-12-15_16:07:11 fhem_server V: 11 S: alive MSG: FHEM Server alive
2013-12-15_16:08:12 fhem_server V: 12 S: alive MSG: FHEM Server alive
2013-12-15_16:09:12 fhem_server V: 12 S: alive MSG: FHEM Server alive
2013-12-15_16:10:12 fhem_server V: 72 S: alive MSG: FHEM Server alive
2013-12-15_16:11:13 fhem_server V: 13 S: alive MSG: FHEM Server alive
2013-12-15_16:12:13 fhem_server V: 13 S: alive MSG: FHEM Server alive


Script versucht diese Datei bei Bedarf anzulegen und die nötigen Rechte zu setzen. Dafür muss es aber Rechte auf das Log-Verzeichnis haben. Unter welchem User läft Watchdog, darf es ins FHEM-Log-Verzeichnis schreiben?

hth

Grüße,

Alexander

Edit: ach ja, Du musst dein FakeLog auch so definieren, dass es mit Jahr und Monat arbeitet:
define FileLog_wathdog FileLog ./log/watchdog-%Y-%m.log fakelog
Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Petrosilius Zwackelmann

#16
Hallo Alexander,

Zitatwarum immer mal wieder eine 'server dead' Meldung kommt, sieht man aus dem Plot ('grüne Säge'). Da, wo die Zacken Stufen haben, hatte Dein FHEM eine 'Gedenkpause' eingelegt. Scheint so, dass Du relativ heftige 'freezes' hast. Schau Dir den Log an, da müssten relativ lange Pausen zu finden sein, diese interpretiert Watchdog als Server-Ausfall. Das wäre kein Problem des Watchdogs, sondern in Deiner Installation zu suchen.

Die grüne Säge läuft ohne jede Stufe wenn ich nicht gerade am testen bin...
Es muss noch irgendwo der Wurm drin sein... Der Watchdog erkennt aber dass der fhem Prozess noch am Laufen ist und überspring den Neustart.

ja hier lag noch ein Fehler... Jahr und Monat fehlte...
Zitatdefine FileLog_wathdog FileLog ./log/watchdog-%Y-%m.log fakelog

Nun scheint es wirklich nur noch am Gplot-File zu liegen...


Ich nehme mal an es sollen die rot markierten Werte ausgewertet werden...
2013-12-15_16:42:18 fhem_server V: 16 S: alive MSG: FHEM Server alive

# Created by FHEM/98_SVG.pm, 2013-12-15 16:47:41
set terminal png transparent size <SIZE> crop
set output '<OUT>.png'
set xdata time
set timefmt "%Y-%m-%d_%H:%M:%S"
set xlabel " "
set title 'Watchdog'
set ytics ("alive" 0, "dead" 1)
set y2tics
set grid
set ylabel "Status"
set y2label "Zeit (s)"
set yrange [-0.1:1.1]
set y2range [0:300]

#FileLog 4:fhem_server.V\x3a:0:
#FileLog 6:fhem_server.V\x3a:0:$fld[5]=~"alive"?0:1

plot "<IN>" using 1:2 axes x1y2 title 'Zeit (s)' ls l5 lw 0.5 with points,\
     "<IN>" using 1:2 axes x1y2 title 'Status' ls l0 lw 1 with points



Kannst du evtl mal dein Gplot nochmal zeigen?

Gruß Manuel
FHEM 6 auf RaspPi V3:
HM_LAN / CUNX / HUEBridge /OneWire / Homebridge / SONOS / Harmony

hexenmeister

Ja, es werden Antwortzeiten Visualisiert (grau), die Ausfälle werden mit Roten Säulen dargestellt.

Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Petrosilius Zwackelmann

#18
Hallo Alexander,

hier habe ich im Sekundenabstand den Befehl zum Anzeigen der fhem.pl Prozesse eingegeben... (ps -ef | grep -v grep | grep fhem.pl)
Erstaunlicherweise werden hier teilweise bis zu 4 Prozesse angezeigt... In der nächste Sekunde ist es dann wieder nur einer.

Ist das Multithreading??


6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12861 admin     32340 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12866 admin     32340 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12886 admin     32376 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12961 admin     32376 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12962 admin     32328 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12963 admin     32336 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12961 admin     32376 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12962 admin     32328 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12963 admin     32336 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12961 admin     32376 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12962 admin     32328 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12963 admin     32336 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12961 admin     32376 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12962 admin     32328 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12963 admin     32336 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12961 admin     32376 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12962 admin     32328 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12963 admin     32336 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12961 admin     32376 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12962 admin     32328 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12963 admin     32336 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12961 admin     32376 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12962 admin     32328 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12963 admin     32336 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12992 admin     32332 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12992 admin     32332 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
12997 admin     32328 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
13008 admin     32336 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg
[/share/external/sds1] # ps -ef | grep -v grep | grep fhem.pl
6722 admin     34868 S   perl /opt/bin/fhem.pl /opt/etc/fhem.cfg


Bitte poste dein gplot File, dann sollte zumindest das Anzeigeproblem gelöst sein.
Danke
Manuel
FHEM 6 auf RaspPi V3:
HM_LAN / CUNX / HUEBridge /OneWire / Homebridge / SONOS / Harmony

hexenmeister

Hi,

ich weiß leider nicht, woher die zusätzlichen Prozesse kommen. Bei mir existiert immer nur ein fhem.pl
Soweit ich weiß, arbeitet FHEM grundsätzlich single threaded. Das bedeutet nicht, dass einzelne Module keine eigene Thread starten können. Aber danach sieht es hier nicht aus. Hier wird wohl wirklich versucht, FHEM zu starten. Dies wird wohl an fehlenden Schreibrechten an Logs scheitern.
Nur um auszuschlissen: Kannst Du dieses Verhalten auch bei abgeschalteten Watchdog beobachten?
sudo ./killwatchdog.sh

Meine Plotdatei findest Du hier: https://github.com/hexenmeister/MyFHEM/blob/master/www/gplot/myWatchdog.gplot

Grüße,

Alexander
Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Petrosilius Zwackelmann

#20
Hallo Alexander,

unabhängig von watchdog werden bei mir mehrere Instanzen von fhem.pl angezeigt.
Ich habe nun noch einen Fehler gefunden... Hatte nicht alle cut Zeilen angepasst um die PID Nummer zu ermitteln....

Nun sammelt sich in einem bestimmten Rhythmus die alive Meldungen im Logfile...
Ich nehme an dieser Teil
checkAlive(){
pid=$(ps -ef | grep -v grep | grep fhem.pl | cut -c1-5);
if test $pid


Kommt nicht mir einer Rückmeldung wie ..
26694
31841
zurecht.

2013-12-15_20:27:52 fhem_server MSG: no FHEM Server process found
2013-12-15_20:26:52 fhem_server V: 52 S: alive MSG: FHEM Server alive
2013-12-15_20:25:52 fhem_server V: 52 S: alive MSG: FHEM Server alive
2013-12-15_20:24:52 fhem_server V: 52 S: alive MSG: FHEM Server alive
2013-12-15_20:21:52 fhem_server MSG: no FHEM Server process found
2013-12-15_20:20:52 fhem_server V: 52 S: alive MSG: FHEM Server alive
2013-12-15_20:19:52 fhem_server V: 52 S: alive MSG: FHEM Server alive
2013-12-15_20:18:52 fhem_server V: 52 S: alive MSG: FHEM Server alive
2013-12-15_20:15:52 fhem_server MSG: no FHEM Server process found
2013-12-15_20:12:52 fhem_server MSG: no FHEM Server process found
2013-12-15_20:11:52 fhem_server V: 49 S: alive MSG: FHEM Server alive
2013-12-15_20:10:52 fhem_server V: 50 S: alive MSG: FHEM Server alive
2013-12-15_20:09:51 fhem_server V: 50 S: alive MSG: FHEM Server alive
2013-12-15_20:08:51 fhem_server V: 51 S: alive MSG: FHEM Server alive
2013-12-15_20:07:51 fhem_server V: 51 S: alive MSG: FHEM Server alive
2013-12-15_20:04:51 fhem_server MSG: no FHEM Server process found
2013-12-15_20:01:51 fhem_server MSG: no FHEM Server process found
2013-12-15_20:00:51 fhem_server V: 50 S: alive MSG: FHEM Server alive
2013-12-15_19:59:51 fhem_server V: 50 S: alive MSG: FHEM Server alive
2013-12-15_19:58:51 fhem_server V: 50 S: alive MSG: FHEM Server alive
2013-12-15_19:57:51 fhem_server V: 50 S: alive MSG: FHEM Server alive



Gruß Manuel
FHEM 6 auf RaspPi V3:
HM_LAN / CUNX / HUEBridge /OneWire / Homebridge / SONOS / Harmony

hexenmeister

Hallo Manuel,

das mit mehreren Instanzen ist merkwürdig, wie gesagt, bei mir immer nur eine da.
Die Prüfung müsste eigentlich (dachte ich zumindest) damit klarkommen, aber das würde dieses Verhalten erklären.
Da an dieser Stelle die Pid als solches je nicht verwendet wird (nur prüfen, ob vorhanden), kannst mal versuchen, das Befehl etwa so abzuändern:

checkAlive(){
cnt=$(ps -ef | grep -v grep | grep fhem.pl | wc -l);
        if test $cnt -gt 0


Damit kommt immer nur eine Zeile raus.
Mal sehen, ob dann Ruhe ist ;)

Grüße,

Alexander


Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Petrosilius Zwackelmann

Hallo Alexander,

seit der Änderung (30 Minuten) keine Probleme mehr.
Vielen Dank für deine Hilfe.

Gruß Manuel
FHEM 6 auf RaspPi V3:
HM_LAN / CUNX / HUEBridge /OneWire / Homebridge / SONOS / Harmony

hexenmeister

Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Spezialtrick

Hallo Hexenmeister,

Danke für die Verlinkung auf deiner Website. ;) Habe nun soweit alle angegebenen Schritte durchgeführt und nun wird mein FHEM alle paar Minuten beendet, aber nicht wieder gestartet. Ich glaube ich habe diesen Abschnitt einen Fehler gemacht:

ZitatBei den Scripten ist sicherzustellen, dass diese ausführbar sind: chmod a+x <Dateiname>
Und sie sollten einem passenden Benutzer gehören (z.B. fhem): chown fhen:fhen <Dateiname>
Der Benutzer, unter dessen Account FHEM ausgeführt wird, muss in die sudo-Gruppe. Damit stellen die Scripte sicher, dass sie die Prozesse in jedem Fall benden können: sudo usermod -aG sudo fhem
Und noch muss dieser User diese Scripte ohne Abfrage mit hohen Rechten ausführen dürfen. Dafür muss die Datei /etc/sudoers ergänzt werden:
Code: [Auswählen]
fhem ALL=(ALL) NOPASSWD: /opt/fhem/runwatchdog.sh, /opt/fhem/killwatchdog.sh, /opt/fhem/watchdogloop.sh, /opt/fhem/runfhem.sh, /opt/fhem/killfhem.sh
Bitte vorsichtig mit dieser Datei! Das sind sicherheitsrelevante Einstellungen! Ist sie kaputt und auch noch der Root-User deaktiviert, hat man sich ausgesperrt.

Bevor man Watchdog aktiviert, sollte man sicherstellen, dass FHEM-Teil richtig läuft, ansonsten wird der FHEM alle 5 Minuten immer und immer wieder restartet.

Ich habe versucht über "ps -ef" herauszufinden überwelchen Benutzer mein FHEM läuft und es müsste ROOT sein, oder?

     root      1987     1  0 15:00 ?        00:00:00 startpar -f -- fhem

Der watchdog läuft unter dem Benutzer fhem:

     fhem      1832     1  0 15:00 ?        00:00:00 /bin/sh ./watchdogloop.sh

Eigentlich müsste doch alles unter ROOT laufen oder nicht? Leider schaffe ich es nicht den Watchdog zu beenden, damit ich weitere Änderungen eingeben kann.

Könntest du mir die genauen Befehle nennen?
FHEM - Debmatic - Zigbee2MQTT - Homekit

hexenmeister

Hallo!

Die Ferndiagnose ist mit diesen Informationen leider etwas schwierig...
Zitatwird mein FHEM alle paar Minuten beendet, aber nicht wieder gestartet.
Das erste bedeutet, dass Watchdog FHEM nicht als lauffähig erkennt. Dafür wird die Datei /opt/fhem/NN_TE_DMST01.Server_Heartbeat-2014-01.log überwacht. Stelle sicher, dass diese Datei existiert (oder passe ggf. die Pfade in watchdogloop.sh entsprechend Deiner Installation an) und auch von FHEM regelmäßig 'befüllt' wird. Das mit dem (nicht) Starten kann schon an falschen Rechten liegen. Was steht in watchdog_err.log und watchdog-2014-01.log? Läuft FHEM an, wenn dieser mit ./startfhem & gestartet wird?


Zitatmein FHEM läuft und es müsste ROOT sein, oder?
Eigentlich keine gute Idee, daher habe ich für den FHEM extra Benutzer angelegt (fhem).

Ich habe keine Ahnung, was 'startpar -f -- fhem' ist, fhem ist das nicht. Was hast Du für ein System, Raspberry Pi?


ZitatLeider schaffe ich es nicht den Watchdog zu beenden, damit ich weitere Änderungen eingeben kann.
sudo killwatchdog.sh
oder
sudo killall watchdogloop.sh
sollte helfen.
Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Prof. Dr. Peter Henning

Ich bin gerne bereit zu helfen, aber der thread ist ehrlich gesagt etwas verworren im Moment. Hat das noch etwas mit OWX zu tun ?

LG

pah

hexenmeister

Zitataber der thread ist ehrlich gesagt etwas verworren im Moment. Hat das noch etwas mit OWX zu tun ?

Hmmm... Irgendwie nicht wirklich.  :o
War sicher nicht ganz korrekt, hier diese Diskussion auszubreiten...
Umbenennen/Verscheieben lassen?
Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Spezialtrick

Sorry wegen der knappen Informationen. Ich wusste nicht so recht was ich alles angeben sollte. Fhem läuft auf meinem Pi Version B.

Habe nun die Pfade in watchdogloop.sh entsprechend meiner Installation angepasst. Ich hatte NN_TE_DMST01.Server_Heartbeat-2014-01.log in Server_Heartbeat-2014-01.log umbenannt. Nun wird die watchdog-2014-01.log auch entsprechend befüllt:

2014-01-09_19:27:50 fhem_server MSG: starting watchdog
2014-01-09_19:27:50 fhem_server MSG: FHEM not runing. starting FHEM...
2014-01-09_19:29:22 fhem_server V: 22 S: alive MSG: FHEM Server alive
2014-01-09_19:30:22 fhem_server V: 22 S: alive MSG: FHEM Server alive
2014-01-09_19:31:23 fhem_server V: 23 S: alive MSG: FHEM Server alive
2014-01-09_19:32:23 fhem_server V: 23 S: alive MSG: FHEM Server alive
2014-01-09_19:33:23 fhem_server V: 23 S: alive MSG: FHEM Server alive
2014-01-09_19:34:23 fhem_server V: 23 S: alive MSG: FHEM Server alive
2014-01-09_19:35:24 fhem_server V: 24 S: alive MSG: FHEM Server alive
2014-01-09_19:36:24 fhem_server V: 24 S: alive MSG: FHEM Server alive
2014-01-09_19:37:24 fhem_server V: 24 S: alive MSG: FHEM Server alive


Das ist die Ausgabe von Server_Heartbeat-2014-01.log:

2014-01-09_19:26:00 Server_Heartbeat 0
2014-01-09_19:26:00 Server_Heartbeat lastChange: 19:26:00
2014-01-09_19:27:00 Server_Heartbeat 1
2014-01-09_19:27:00 Server_Heartbeat lastChange: 19:27:00
2014-01-09_19:29:00 Server_Heartbeat 2
2014-01-09_19:29:00 Server_Heartbeat lastChange: 19:29:00
2014-01-09_19:30:00 Server_Heartbeat 3
2014-01-09_19:30:00 Server_Heartbeat lastChange: 19:30:00
2014-01-09_19:31:00 Server_Heartbeat 4
2014-01-09_19:31:00 Server_Heartbeat lastChange: 19:31:00
2014-01-09_19:32:00 Server_Heartbeat 5
2014-01-09_19:32:00 Server_Heartbeat lastChange: 19:32:00
2014-01-09_19:33:00 Server_Heartbeat 6
2014-01-09_19:33:00 Server_Heartbeat lastChange: 19:33:00
2014-01-09_19:34:00 Server_Heartbeat 7
2014-01-09_19:34:00 Server_Heartbeat lastChange: 19:34:00
2014-01-09_19:35:00 Server_Heartbeat 8
2014-01-09_19:35:00 Server_Heartbeat lastChange: 19:35:00
2014-01-09_19:36:00 Server_Heartbeat 9
2014-01-09_19:36:00 Server_Heartbeat lastChange: 19:36:00
2014-01-09_19:37:00 Server_Heartbeat 10
2014-01-09_19:37:00 Server_Heartbeat lastChange: 19:37:00
2014-01-09_19:38:00 Server_Heartbeat 11
2014-01-09_19:38:00 Server_Heartbeat lastChange: 19:38:00


Nachfolgend die Ausgabe von watchdog_err.log:

./startfhem: 31: ./startfhem: cannot create log/watchdog_err.log: Permission denied
Subroutine trim redefined at ./FHEM/42_SYSMON.pm line 966, <$fh> line 49.
Use of uninitialized value $a[1] in substitution (s///) at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value in join or string at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value $a[1] in substitution (s///) at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value in join or string at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value $a[1] in substitution (s///) at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value in join or string at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value $a[1] in substitution (s///) at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value in join or string at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value $a[1] in substitution (s///) at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value in join or string at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value $a[1] in substitution (s///) at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value in join or string at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value $a[1] in substitution (s///) at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value in join or string at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value $a[1] in substitution (s///) at ./FHEM/98_SVG.pm line 938.
Use of uninitialized value in join or string at ./FHEM/98_SVG.pm line 938.


Fhem läuft nun mit "./startfhem" problemlos an und wird auch nicht mehr nach paar Minuten beendet. Das einzige Problem, das weiterhin besteht ist der untere Plot nicht funktioniert. Das Diagramm wird korrekt angezeigt, aber leider ohne Graph bzw. Balken.
FHEM - Debmatic - Zigbee2MQTT - Homekit

hexenmeister

Plots erlauben zwar den Überblick über die Ausfälle, sind jedoch eher 'Zierde' ;)
Wichtig wäre zu prüfen, ob Watchdog den FHEM-Server bei Bedarf auch starten kann. Zum Testen reicht den FHEM zu beenden. Solle nach ca. 1 Minute wieder anlaufen und bald darauf wieder ansprechbar sein.

Wie sehen die Definitionen für Plots in fhem.cfg? Da Du die Logs umbenannt hat, müssen auch diese Einstellungen entsprechend angepasst werden.
Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy