FHEM muss laufend neu gestartet werden

Begonnen von ahstax, 06 Juni 2018, 06:14:30

Vorheriges Thema - Nächstes Thema

Wernieman

Und wenn Du denkst, das Du "/etc/init.d/fhem" verändert hast, das poste Sie doch einfach ...

hier sind viele helle Köpfe, aber ohne Informationen werden Sie Dir nichts sagen können ....

sie werden Dir nur "Hilfe zur Selbsthilfe" geben können ....n

Btw. Es ist niemals klug, einfach nur FHEM Neustarten zu lassen. Zuerst sollte man immer Versuchen, das Problem zu finden und zu lösen. Der Fhem "Absturz" ist meistens nicht das Problem, sondern nur das Symptom. Ein Neustart behebt also das Symptom aber nicht das Problem und somit ist es nicht die Lösung

(Ausnahmen bestätigen die Regel)
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

ahstax

Hallo,

Danke für die Antworten.

in der fhem.log findet sich immer, wenn ein Neustart war, um den Eintrag "Server shutdown" folgendes
Meistens so:
2018.06.02 02:14:13 1: checkFritzMACpresent (FritzBox_MAIN): mac_70_70_0D_8A_6A_E0 gefunden, Gerät heißt >haiFohn (WLAN, 144 / 62 Mbit/s, -67)<.
2018.06.02 02:14:13 1: checkFritzMACpresent (FritzBox_MAIN): mac_4C_66_41_01_52_89 gefunden, Gerät heißt >Galaxy-S6 (WLAN, 124 / 29 Mbit/s, -66)<.
2018.06.02 02:16:09 0: Server shutdown
2018.06.02 01:17:08 1: Including fhem.cfg

einmal so:
2018.06.02 07:01:44 1: FHEMWEB SSL/HTTPS error:  SSL accept attempt failed (peer: 192.168.2.100)
2018.06.02 07:01:48 1: RMDIR: ./restoreDir/save/2018-05-30
2018.06.02 07:01:49 0: Server shutdown
2018.06.02 06:18:08 1: Including fhem.cfg

einmal so:
2018.06.03 02:59:21 3: CALVIEW cv_Christine - CALENDAR:Kalender_Christine triggered, updating CALVIEW cv_Christine ...
2018.06.03 02:59:27 1: PERL WARNING: Use of uninitialized value in split at ./FHEM/57_CALVIEW.pm line 220.
2018.06.03 02:59:27 1: PERL WARNING: Use of uninitialized value $endday in concatenation (.) or string at ./FHEM/57_CALVIEW.pm line 223.
2018.06.03 02:59:27 1: PERL WARNING: Use of uninitialized value in concatenation (.) or string at ./FHEM/57_CALVIEW.pm line 223.
2018.06.03 02:59:27 1: PERL WARNING: Use of uninitialized value $endday in string eq at ./FHEM/57_CALVIEW.pm line 224.
2018.06.03 02:59:27 1: PERL WARNING: Use of uninitialized value in concatenation (.) or string at ./FHEM/57_CALVIEW.pm line 226.
2018.06.03 03:00:02 0: Server shutdown
2018.06.03 03:00:10 1: Including fhem.cfg
2018.06.03 03:00:10 3: telnetPort: port 7072 opened


in syslog ist folgendes vor und nach einem Neustart
Jun  5 04:43:26 bat-cave watchdog[1011]: file /opt/fhem/log/fhem.save was not changed in 2059 seconds (more than 2000)
Jun  5 04:43:27 bat-cave watchdog[1011]: file /opt/fhem/log/fhem.save was not changed in 2060 seconds (more than 2000)
Jun  5 04:43:28 bat-cave watchdog[1011]: file /opt/fhem/log/fhem.save was not changed in 2061 seconds (more than 2000)
Jun  5 04:43:29 bat-cave watchdog[1011]: file /opt/fhem/log/fhem.save was not changed in 2062 seconds (more than 2000)
Jun  5 04:43:29 bat-cave watchdog[1011]: Retry timed-out at 61 seconds for /opt/fhem/log/fhem.save
Jun  5 04:43:29 bat-cave watchdog[1011]: shutting down the system because of error 250 = 'file was not changed in the given interval'
Jun  5 04:43:29 bat-cave watchdog[1011]: /usr/lib/sendmail does not exist or is not executable (errno = 2)
#NEUSTART
Jun  5 04:44:12 bat-cave systemd[1]: Time has been changed
Jun  5 04:44:12 bat-cave ntpdate[521]: step time server 192.168.2.1 offset 1611.151038 sec
Jun  5 04:44:12 bat-cave systemd[760]: Time has been changed
Jun  5 04:44:12 bat-cave systemd[1]: apt-daily-upgrade.timer: Adding 24min 16.734271s random time.
Jun  5 04:44:12 bat-cave systemd[1]: apt-daily.timer: Adding 7h 6min 39.604958s random time.
Jun  5 04:44:13 bat-cave ntpd[584]: ntpd 4.2.8p10@1.3728-o Sat Mar 10 18:03:33 UTC 2018 (1): Starting
Jun  5 04:44:13 bat-cave ntpd[584]: Command line: /usr/sbin/ntpd -p /var/run/ntpd.pid -g -c /run/ntp.conf.dhcp -u 111:117
Jun  5 04:44:13 bat-cave ntp[551]: Starting NTP server: ntpd.
Jun  5 04:44:13 bat-cave systemd[1]: Started LSB: Start NTP daemon.
Jun  5 04:44:13 bat-cave ntpd[814]: proto: precision = 1.198 usec (-20)


In der /etc/init.d/fhem steht folgendes:

#!/bin/sh
# description: Start or stop the fhem server
# Added by Alex Peuchert

### BEGIN INIT INFO
# Provides:             fhem.pl
# Required-Start:       $local_fs $remote_fs
# Required-Stop:        $local_fs $remote_fs
# Default-Start:        2 3 4 5
# Default-Stop:         0 1 6
# Short-Description:    FHEM server
### END INIT INFO

set -e
cd /opt/fhem
port=7072

if test "$2" != "noaptmark"; then
  apt-mark hold fhem > /dev/null
fi

case "$1" in
'start')

        echo "Starting fhem..."

# if you need to start hmland for use with
# Homematic, please start the hmland daemon
# like this (please use correct path and port,
# depending on your installation!)
#
#       /opt/hmcfgusb/hmland -d -p 1234 -r 0
#

        perl fhem.pl fhem.cfg

# if you want to use configDB for configuration,
# use this command to start fhem:
#
#       perl fhem.pl configDB
#
# and remove/comment the above line including fhem.cfg

        RETVAL=$?
        ;;
'stop')
        echo "Stopping fhem..."

# if you want to stop hmland during fhem stop:
#       pkill hmland

        pkill -U fhem perl
        RETVAL=$?
        ;;
'status')
        cnt=`ps -ef | grep "fhem.pl" | grep -v grep | wc -l`
        if [ "$cnt" -eq "0" ] ; then
                echo "fhem is not running"
        else
                echo "fhem is running"
        fi
        ;;
*)
        echo "Usage: $0 { start | stop | status }"
        RETVAL=1
        ;;
esac
exit $RETVAL


Hilft das?

MadMax-FHEM

#17
Wenn ich das richtig sehe hast du einen Watchdog der auf Änderung von /opt/fhem/log/fhem.save schaut und wenn diese 2000 Sekunden (also ca. 33min plus so wie es aussieht ein wenig "Zugabe") ausbleibt wird aber so wie es aussieht nicht nur fhem sondern der ganze Rechner neu gestartet...

Evtl. ist ja etwas wie das hier der Grund: https://forum.fhem.de/index.php?topic=20132.0
(nur als Beispiel verstehen)

Also ein Grund dass die Datei nicht geschrieben wird und nichts mit einem Hänger zu tun hat...
...oder fhem hängt tatsächlich, dann ist es aber besser den Watchdog mal zu deaktivieren und nach der Ursache zu suchen...
...wie Wernieman ja bereits geschrieben hatte...

EDIT: btw. ich habe gerade mal bei meinen Systemen geschaut. Hauptsystem letztes Schreiben vor ca. 7min (Zufall? Hat sich die letzten 3min nicht geändert) und bei meinem Testsystem schon seit ca. 2h nicht mehr... Bin aber ziemlich sicher, dass die Systeme nicht hängen. Reagieren geschmeidig und FreezeMon zeigt auch keine Schwäche...

Gruß, Joachim
FHEM PI3B+ Bullseye: HM-CFG-USB, 40x HM, ZWave-USB, 13x ZWave, EnOcean-PI, 15x EnOcean, HUE/deCONZ, CO2, ESP-Multisensor, Shelly, alexa-fhem, ...
FHEM PI2 Buster: HM-CFG-USB, 25x HM, ZWave-USB, 4x ZWave, EnOcean-PI, 3x EnOcean, Shelly, ha-bridge, ...
FHEM PI3 Buster (Test)

fiedel

Zitat von: MadMax-FHEM am 07 Juni 2018, 00:01:04
EDIT: btw. ich habe gerade mal bei meinen Systemen geschaut. Hauptsystem letztes Schreiben vor ca. 7min (Zufall? Hat sich die letzten 3min nicht geändert) und bei meinem Testsystem schon seit ca. 2h nicht mehr... Bin aber ziemlich sicher, dass die Systeme nicht hängen. Reagieren geschmeidig und FreezeMon zeigt auch keine Schwäche...

Gruß, Joachim

Vermutlich gibt es zum Watchdog dazu noch ein at, welches alle X Minuten ein Save auslöst, oder so. Aber die FHEM- Installation scheint wirklich nicht Fehlerfrei zu sein. Ich sage also auch nochmal: Watchdog aus und die FHEM- Einrichtung bereinigen. Also nach und nach alle Fehlermeldungen aus dem Log verstehen und beseitigen, indem der entspr. Programmteil korrigiert wird.
FeatureLevel: 6.1 auf Wyse N03D ; Deb. 11 ; Perl: v5.14.2 ; IO: HM-MOD-RPI-PCB + VCCU|CUL 868 V 1.66|LinkUSBi |TEK603
HM: SEC-SCO|SCI-3-FM|LC-SW4-PCB|ES-PMSW1-PL|RC-4-2|SEN-MDIR-O|SEC-WDS-2
CUL: HMS100TF|FS20 S4A-2 ; OWDevice: DS18S20|DS2401|DS2406|DS2423

Prof. Dr. Peter Henning

Zitat"etwas Ironie und Sarkasmus" ist wohl üblich anstelle von Sachlichkeit.
Wir benötigen ganz dringend neue Forumsmitglieder, deren bisherige 2 (in Worten: zwei) Beiträge sich ausschließlich mit dem angeblichen Tonfall anderer Posts befassen und sonst keinerlei Inhalt haben.  Vielleicht sollten wir einen neuen Forumsbereich für Amateurpsychologen aufmachen.

ZitatIch glaube aber, dass ich noch mehr gemacht habe, weiß es aber, wie gesagt nicht mehr...

Man sollte sich wenigstens an das Letzte erinnern, das man vor dem Auftreten eines Fehlers geändert hat - in den meisten Fällen wird das die Fehlerquelle sein. Im vorliegenden Fall schient es aber wirklich das Beste zu sein, die inzwischen wahrscheinlich vollkommen inkonsistente Installation  neu aufzusetzen. Ohne Watchdog.

LG

pah