[Gelöst] Ungeplante Fhem-Neustarts

Begonnen von Gisbert, 10 September 2022, 15:07:46

Vorheriges Thema - Nächstes Thema

Beta-User

Zitat von: MadMax-FHEM am 12 September 2022, 12:48:42
Was mir noch einfällt: watchdog. Hast du einen eingerichtet? Also ich meine jetzt "System-Watchdog" nicht einen Watchdog/Modul/Device in fhem... ;)
systemd selbst ist eine Art watchdog, und genau das scheint hier immer mal wieder zugeschlagen zu haben, ein Blick ins syslog sollte das ggf. bestätigen.

Zitat von: Gisbert am 12 September 2022, 12:43:44konsequent überall event-on-change-reading .* gesetzt. Damit werden die Events gefühlt auf die Hälfte reduziert.
Diese Pauschallösung finde ich immer noch gruselig, aber ok, es ist ein Anfang...

Was RAM angeht, könntest du ggf. noch schauen, was da im BIOS für Grafik reserviert ist. Evtl. kannst du da was freigeben, du hast ja keine GUI laufen, oder? (Trotzdem wäre es interessant rauszufinden, warum das Ding so schnell anfängt zu swappen, meiner macht das afaik praktisch nie).
Server: HP-elitedesk@Debian 12, aktuelles FHEM@ConfigDB | CUL_HM (VCCU) | MQTT2: MiLight@ESP-GW, BT@OpenMQTTGw | MySensors: seriell, v.a. 2.3.1@RS485 | ZWave | ZigBee@deCONZ | SIGNALduino | MapleCUN | RHASSPY
svn: u.a MySensors, Weekday-&RandomTimer, Twilight,  div. attrTemplate-files

MadMax-FHEM

Zitat von: Beta-User am 12 September 2022, 13:25:28
systemd selbst ist eine Art watchdog, und genau das scheint hier immer mal wieder zugeschlagen zu haben, ein Blick ins syslog sollte das ggf. bestätigen.

Jep aber durch einen "system-Watchdog" (sowas wie: fhem schreibt/verändert eine Datei und "das system" prüft das und wenn fhem hängt, dann wird neu gestartet) kommen u.U. weitere "Kriterien" für einen Neustart dazu, zusätzlich zu dem was systemd schon als Grund für "ich starte besser mal neu" hält...

So in der Art: https://forum.fhem.de/index.php?topic=25110.0 / https://raw.githubusercontent.com/hexenmeister/MyFHEM/master/FHEM/98_systemd_watchdog.pm

Nutze ich nicht aber es gab ab und an deswegen auch schon Neustarts, von denen die Anwender überrascht waren, bis sie eben drauf gekommen sind, dass sie (irgendwann) doch mal so einen Watchdog eingerichtet haben ;)

Gruß, Joachim
FHEM PI3B+ Bullseye: HM-CFG-USB, 40x HM, ZWave-USB, 13x ZWave, EnOcean-PI, 15x EnOcean, HUE/deCONZ, CO2, ESP-Multisensor, Shelly, alexa-fhem, ...
FHEM PI2 Buster: HM-CFG-USB, 25x HM, ZWave-USB, 4x ZWave, EnOcean-PI, 3x EnOcean, Shelly, ha-bridge, ...
FHEM PI3 Buster (Test)

Gisbert

Hallo Jörg,

um ins BIOS reinzukommen, muss ich wohl einen Bildschirm und Tastatur anschließen und den Server neu starten.
Kann man evtl. mit dem folgenden erkennen, ob sich die Aktion lohnen könnte?
sudo dmidecode -t bios
# dmidecode 3.3
Getting SMBIOS data from sysfs.
SMBIOS 2.7 present.

Handle 0x0000, DMI type 0, 24 bytes
BIOS Information
        Vendor: Hewlett-Packard
        Version: K30 v01.16
        Release Date: 05/24/2013
        Address: 0xF0000
        Runtime Size: 64 kB
        ROM Size: 4 MB
        Characteristics:
                PCI is supported
                BIOS is upgradeable
                BIOS shadowing is allowed
                Boot from CD is supported
                Selectable boot is supported
                EDD is supported
                Print screen service is supported (int 5h)
                8042 keyboard services are supported (int 9h)
                Serial services are supported (int 14h)
                Printer services are supported (int 17h)
                ACPI is supported
                USB legacy is supported
                BIOS boot specification is supported
                Function key-initiated network boot is supported
                UEFI is supported
        BIOS Revision: 1.16

Handle 0x001F, DMI type 13, 22 bytes
BIOS Language Information
        Language Description Format: Long
        Installable Languages: 12
                en|US|iso8859-1
                fr|FR|iso8859-1
                es|ES|iso8859-1
                de|DE|iso8859-1
                it|IT|iso8859-1
                da|DK|iso8859-1
                fi|FI|iso8859-1
                nl|NL|iso8859-1
                no|NO|iso8859-1
                pt|PT|iso8859-1
                sv|SE|iso8859-1
                ja|JP|unicode
        Currently Installed Language: en|US|iso8859-1


ZitatSystem-Watchdog
Ich glaub, dass ich nichts eingerichtet hab, ich werde meine Installationsdoku noch durchsehen.


Hallo Joachim,

Ich hab DOIFtools definiert, mir ist aber auch nach dem Durchlesen des Wikiartikels und der Commander unklar, was ich nun tun kann/soll.
defmod DOIFtools DOIFtools associated DOIF: Anwesenheit.Zuhause Bad.Alarm BewegungsmelderFlurEG BewegungsmelderGarage Gaeste_WC.Alarm Garagentor.Alarm HKV.Bad HKV.EG HKV.OG Haushaltsraum.Lueftung Haustuer.Licht.Schaltzeit HeizungWarmwasser Heizung_alive Heizung_pressure Heizung_start IntervalSpeedtest Klingeln Kondensatbehaelter.Alarm Lichterkette.Schaltzeit Muellabfuhr PIRWestAlarm RollladengruppeOG RollladengruppeUp RollladengruppeWZ Rufumleitung SZ.Gisbert.Alarm Spitzboden.Lueftung Stellantriebe_reset Terrasse.Licht.Schaltzeit TreppenhausMarkisenBefehl Ueberwachung Update.Blitzer Update.Dieselpreise Update.Indices Warmwasser.Zirkulation Wohnzimmer.Licht.Fernseher Zeit_Warmwasser day_BatterySmokeDetector missedCall myreadingsWatcher_UAP_AC_LR_EG restart.FHEM
attr DOIFtools room Network

setstate DOIFtools initialized
setstate DOIFtools 2022-09-12 13:46:18 .t0 1662983178.03735
setstate DOIFtools 2022-09-12 13:46:18 .te 0
setstate DOIFtools 2022-09-12 13:46:18 Action event recording stopped and data deleted
setstate DOIFtools 2022-09-12 13:38:23 DOIF_version 98_DOIF.pm 26182 2022-06-29 18:57:26Z Damian
setstate DOIFtools 2022-09-12 13:46:18 doStatistics disabled
setstate DOIFtools 2022-09-12 13:47:27 recording_target_duration 168
setstate DOIFtools 2022-09-12 13:27:46 state initialized
setstate DOIFtools 2022-09-12 13:46:18 statisticHours 0.00
setstate DOIFtools 2022-09-12 13:46:18 statisticsTYPEs MQTT_DEVICE


Viele Grüße Gisbert
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY

Beta-User

Zitat von: Gisbert am 12 September 2022, 15:04:45
Kann man evtl. mit dem folgenden erkennen, ob sich die Aktion lohnen könnte?
Schau mal hier rein, da hat sich jemand intensiver mit dem Thema beschäftigt:
https://www.parkytowers.me.uk/thin/hp/t610/firmware.shtml

Server: HP-elitedesk@Debian 12, aktuelles FHEM@ConfigDB | CUL_HM (VCCU) | MQTT2: MiLight@ESP-GW, BT@OpenMQTTGw | MySensors: seriell, v.a. 2.3.1@RS485 | ZWave | ZigBee@deCONZ | SIGNALduino | MapleCUN | RHASSPY
svn: u.a MySensors, Weekday-&RandomTimer, Twilight,  div. attrTemplate-files

MadMax-FHEM

Äh, also bei mir sind da Knöpfe zum Drücken:

set doStatistics enable (wenn noch nicht aktiv ansonsten: disable)

get statisticsReport -> man bekommt die Übersicht

Gruß, Joachim
FHEM PI3B+ Bullseye: HM-CFG-USB, 40x HM, ZWave-USB, 13x ZWave, EnOcean-PI, 15x EnOcean, HUE/deCONZ, CO2, ESP-Multisensor, Shelly, alexa-fhem, ...
FHEM PI2 Buster: HM-CFG-USB, 25x HM, ZWave-USB, 4x ZWave, EnOcean-PI, 3x EnOcean, Shelly, ha-bridge, ...
FHEM PI3 Buster (Test)

Gisbert

Zitat von: MadMax-FHEM am 12 September 2022, 15:50:10
Äh, also bei mir sind da Knöpfe zum Drücken:

set doStatistics enable (wenn noch nicht aktiv ansonsten: disable)

get statisticsReport -> man bekommt die Übersicht

Gruß, Joachim

Hallo Joachim,
bei dem Style für mein Handy gibt es keine Knöpfe. Bei dem "üblichen" Style gibt es die Knöpfe - funktioniert.
Viele Grüße Gisbert
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY

frank

der syslog ausschnitt beim crash fehlt noch.
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

Gisbert

Zitat von: frank am 12 September 2022, 18:40:45
der syslog ausschnitt beim crash fehlt noch.

Hallo Frank,
mache ich gerne, aber ich benötige Hilfe, ich weiß nicht, wie ich das anstellen kann.

Viele Grüße Gisbert
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY

Wernieman

Mit syslog meint er: /var/log/syslog
sudo cat /var/log/syslog

Und um den Zeitpunkt des Reboots die Zeilen posten.

P.S. Wenn es zu viel ist, geht auch less:
sudo less /var/log/syslog
mit PageUp/Down scrollen und mit q beenden. Copy&Paste mit der Maus
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Gisbert

Hallo Wernieman,
ich schaue, ob ich den Zeitpunkt des letzten Absturzes noch hinbekomme. Ich muss in die Fhem-Logs reinschauen, um den Zeitpunkt wiederzufinden.
Viele Grüße Gisbert
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY

Gisbert

Hallo Wernieman,
hallo Frank,

an die Informationen beim Absturz komme ich anscheinend nicht mehr ran, da ich später den Server selbst neu gestartet habe, nachdem ich den swappiness-Wert geändert hatte. Dann muss ich auf den nächsten Absturz warten und das Ergebnis posten.
ZitatMit syslog meint er: /var/log/syslog
sudo cat /var/log/syslog

Viele Grüße Gisbert
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY

Wernieman

ls -lha /var/log/syslog*

Je nach Systemeinstellung wird das Logfile "rotiert" und komprimiert. Ältere Dateien kannst Du lesen mit:
zcat /var/log/syslogXXX
XXX bitte durch die Endung ergänzen, wie z.B. .1 oder .1.gz, je nach Systemeinstellung. Zum scrollen:
zcat /var/log/syslogXXX | less
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

frank

augen auf und probieren/anschauen:
auf meinem pi gibt es 8 dateien, letzte 7 tage plus aktueller tag.
/var/log/syslog
/var/log/syslog.1
/var/log/syslog.2.gz
/var/log/syslog.3.gz
/var/log/syslog.4.gz
/var/log/syslog.5.gz
/var/log/syslog.6.gz
/var/log/syslog.7.gz
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

Wernieman

#28
mit Absicht hatte ich bei ls die Parameter "-lha" gesetzt:
-l: Nicht nur Dateiname, sondern auch Benutzer, ketzte Änderung etc. Anzeigen (long Listing)
-h: Menschlich lesbare Größenangabe (Human-readable)
-a: Alle Dateien anzeigen, also auch die Geschützten Dateien, (Die mit dem ".")

Eigentlich währe für Dich -l ausreichend gewesen, da dort auch das Dateidatum angezeigt wird, aber automatisch verwende ich immer die Kombi der 3 Parameter.

Kannst Du uns bitte mal den kompletten Output geben:
ls -lha /var/log/syslog*
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Gisbert

Hallo Wernieman,
hallo Frank,

hier der Auszug aus dem syslogfile zur Zeit des ungeplanten Fhem-Neustarts (insbesondere bei 01:00:00):
Sep  9 00:00:53 HPT610 systemd[1]: Starting Rotate log files...
Sep  9 00:00:53 HPT610 systemd[1]: Starting Daily man-db regeneration...
Sep  9 00:00:53 HPT610 systemd[1]: Reloading The Apache HTTP Server.
Sep  9 00:00:53 HPT610 systemd[1]: Reloaded The Apache HTTP Server.
Sep  9 00:00:53 HPT610 systemd[1]: logrotate.service: Succeeded.
Sep  9 00:00:53 HPT610 systemd[1]: Finished Rotate log files.
Sep  9 00:00:55 HPT610 systemd[1]: man-db.service: Succeeded.
Sep  9 00:00:55 HPT610 systemd[1]: Finished Daily man-db regeneration.
Sep  9 00:00:55 HPT610 systemd[1]: man-db.service: Consumed 1.239s CPU time.
Sep  9 00:09:00 HPT610 systemd[1]: Starting Clean php session files...
Sep  9 00:09:01 HPT610 systemd[1]: phpsessionclean.service: Succeeded.
Sep  9 00:09:01 HPT610 systemd[1]: Finished Clean php session files.
Sep  9 00:09:01 HPT610 CRON[1013635]: (root) CMD (  [ -x /usr/lib/php/sessionclean ] && if [ ! -d /run/systemd/system ]; then /usr/lib/php/sessionclean; fi)
Sep  9 00:10:01 HPT610 CRON[1013658]: (root) CMD (   PATH="$PATH:/usr/sbin:/usr/local/bin/" pihole updatechecker local)
Sep  9 00:17:01 HPT610 CRON[1013848]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Sep  9 00:20:01 HPT610 CRON[1013917]: (root) CMD (   PATH="$PATH:/usr/sbin:/usr/local/bin/" pihole updatechecker local)
Sep  9 00:30:01 HPT610 CRON[1014181]: (root) CMD (   PATH="$PATH:/usr/sbin:/usr/local/bin/" pihole updatechecker local)
Sep  9 00:39:00 HPT610 systemd[1]: Starting Clean php session files...
Sep  9 00:39:01 HPT610 systemd[1]: phpsessionclean.service: Succeeded.
Sep  9 00:39:01 HPT610 systemd[1]: Finished Clean php session files.
Sep  9 00:39:01 HPT610 CRON[1014482]: (root) CMD (  [ -x /usr/lib/php/sessionclean ] && if [ ! -d /run/systemd/system ]; then /usr/lib/php/sessionclean; fi)
Sep  9 00:40:01 HPT610 CRON[1014504]: (root) CMD (   PATH="$PATH:/usr/sbin:/usr/local/bin/" pihole updatechecker local)
Sep  9 00:50:01 HPT610 CRON[1014757]: (root) CMD (   PATH="$PATH:/usr/sbin:/usr/local/bin/" pihole updatechecker local)
Sep  9 01:00:00 HPT610 kernel: [2030065.219487] traps: perl[781100] trap stack segment ip:55e7a0d578e4 sp:7ffea21be1b0 error:0 in perl[55e7a0d1d000+185000]
Sep  9 01:00:00 HPT610 systemd[1]: fhem.service: Main process exited, code=killed, status=7/BUS
Sep  9 01:00:01 HPT610 CRON[1015022]: (root) CMD (   PATH="$PATH:/usr/sbin:/usr/local/bin/" pihole updatechecker local)
Sep  9 01:01:30 HPT610 systemd[1]: fhem.service: State 'stop-sigterm' timed out. Killing.
Sep  9 01:01:30 HPT610 systemd[1]: fhem.service: Killing process 781133 (perl) with signal SIGKILL.
Sep  9 01:01:30 HPT610 systemd[1]: fhem.service: Failed with result 'signal'.
Sep  9 01:01:30 HPT610 systemd[1]: fhem.service: Consumed 20h 47min 33.019s CPU time.
Sep  9 01:01:30 HPT610 systemd[1]: fhem.service: Scheduled restart job, restart counter is at 7.
Sep  9 01:01:30 HPT610 systemd[1]: Stopped FHEM Home Automation.
Sep  9 01:01:30 HPT610 systemd[1]: fhem.service: Consumed 20h 47min 33.019s CPU time.
Sep  9 01:01:30 HPT610 systemd[1]: Starting FHEM Home Automation...
Sep  9 01:01:32 HPT610 systemd[1]: Started FHEM Home Automation.
Sep  9 01:02:57 HPT610 unbound[631]: [1662678177] unbound[631:0] info: generate keytag query _ta-4f66. NULL IN
Sep  9 01:09:00 HPT610 systemd[1]: Starting Clean php session files...
Sep  9 01:09:01 HPT610 CRON[1015294]: (root) CMD (  [ -x /usr/lib/php/sessionclean ] && if [ ! -d /run/systemd/system ]; then /usr/lib/php/sessionclean; fi)
Sep  9 01:09:01 HPT610 systemd[1]: phpsessionclean.service: Succeeded.
Sep  9 01:09:01 HPT610 systemd[1]: Finished Clean php session files.
Sep  9 01:10:01 HPT610 CRON[1015357]: (root) CMD (   PATH="$PATH:/usr/sbin:/usr/local/bin/" pihole updatechecker local)
Sep  9 01:17:01 HPT610 CRON[1015546]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Sep  9 01:20:01 HPT610 CRON[1015614]: (root) CMD (   PATH="$PATH:/usr/sbin:/usr/local/bin/" pihole updatechecker local)
Sep  9 01:25:24 HPT610 signal-cli[165265]: WARN  ReceiveHelper - Connection closed unexpectedly, reconnecting in 100 ms
Sep  9 01:30:01 HPT610 CRON[1015871]: (root) CMD (   PATH="$PATH:/usr/sbin:/usr/local/bin/" pihole updatechecker local)
Sep  9 01:39:00 HPT610 systemd[1]: Starting Clean php session files...
Sep  9 01:39:01 HPT610 systemd[1]: phpsessionclean.service: Succeeded.
Sep  9 01:39:01 HPT610 systemd[1]: Finished Clean php session files.


2022.09.09 01:01:32.403 1: Including fhem.cfg
2022.09.09 01:01:32.860 3: WEB: port 8083 opened
2022.09.09 01:01:32.942 3: WEBphone: port 8084 opened
2022.09.09 01:01:32.952 3: WEBtablet: port 8085 opened
2022.09.09 01:01:32.973 3: httpWEB: port 8086 opened
2022.09.09 01:01:32.989 3: telnetPort: port 7072 opened


Viele Grüße Gisbert
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY