Hauptmenü

FHEM hängt sich auf

Begonnen von Wetterhexe, 04 Oktober 2021, 09:43:46

Vorheriges Thema - Nächstes Thema

Wetterhexe

Hallo,

ich hab seit einigen Tagen das Problem, daß FHEM sich einfach aufhängt. Der Webserver reagiert nicht mehr, lokales login mit telnet geht ebenfalls nicht mehr. Die Instanz läßt sich mit systemctl auch nicht mehr stoppen, es bleiben perl Restprozesse übrig, die sich nur mehr mit "kill -9" terminieren lassen. Danach kann ich wieder starten und alles läuft für ein paar Stunden wieder, bis zum nächsten Hänger.

In dem fhem logs sind keine Fehlermeldungen zu finden. Die Linux systemlogs sind ebenfalls unauffällig.
Ich hatte auch keine updates in letzter Zeit, weder am System selbst noch an fhem (als die Probleme anfingen habe ich mal fhem auf neuesten Stand gebracht, änderte aber nichts am Problem).

Langsam gehen mir echt die Ideen aus wie ich da weiterkommen könnte. Hab mal auf Verdacht den globalen loglevel auf 3 erhöht, aber damit auch nichts aussagekräftiges gefunden.

Hat jemand eine Idee wo ich ansetzen könnte? Bin echt für jeden Hinweis dankbar!

Vielen Dank schon mal,
Christina

Wernieman

Wie sieht es ansonsten mit dem System aus?
Also Prozesslast, load, io etc.?
Stichworte:
top
free
iftop
iotop
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Wetterhexe

Zitat von: Wernieman am 04 Oktober 2021, 09:47:10
Wie sieht es ansonsten mit dem System aus?
der Server ist ziemlich überdimensioniert. Zwar schon ein älteres Semster (core2duo), aber läuft seit vielen Jahren völlig problemlos.
Außer fhem (mit mariadb und grafana) läuft noch dhcp und bind (für eine Handvoll devices).
cpu load geht kaum über 10%, bei komplexeren sql queries schon auch mal kurz auf 100%. War in der Vergangenheit nie ein Problem. Wie gesagt, mit Änderungen am System bin ich sehr sparsam.


# free
              total        used        free      shared  buff/cache   available
Mem:        6105108     1132220      344388       93420     4628500     4591188
Swap:             0           0           0

Jamo

Ich hatte mal ein HTTPMOD device zum abrufen des Fernsehprogramms. Der Betreiber hatte Änderungen an seiner Website, danach ist der HTTPMOD regexp in einer endlosschleife gelaufen, mit dem Effekt wie von Dir beschrieben. Da ich die Abfrage unregelmässig gemacht habe, trat der Effekt auch immer nur nach einiger Zeit auf. Ein Log 5 bis zum Zeitpunkt des hängers brachte schliesslich den Verursacher ans Tageslicht.
Bullseye auf iNUC, Homematic + HMIP(UART/HMUSB), Debmatic, HUEBridge, Zigbee/Conbee III, FB7690, Alexa (fhem-lazy), Livetracking, LaCrosse JeeLink, LoRaWan / TTN / Chirpstack, Sonos, ESPresence

Wetterhexe

Zitat von: Jamo am 04 Oktober 2021, 11:08:40
Ich hatte mal ein HTTPMOD device ...
Danke für den Tip! Ich habe tatsächlich zwei davon (den homematic firmware check, und einen für den weatherman). Bislang waren die unauffällig, aber ich werd mal verbose aufdrehen und beobachten.

Wetterhexe

UPDATE: nachdem ich die HTTPMODs eine Weile gelogged hatte, konnte ich die als Übeltäter ausschließen ... die crashes paßten nicht dazu.

Hatte einige Stunden global verbose 5 gelogged, und dabei ist mir das 57_Calendar.pm aufgefallen. Das habe ich jetzt eine Woche lang beobachtet ... die crashes lassen sich zu 80% zu Fehlern im log matchen, die sich auf das Modul beziehen. Ich hab jetzt mal vorsorglich meine Kalender devices gelöscht (sind nett aber nicht lebenswichtig), und werde weiter beobachten ...

So siehts im log aus:
Zitat
2021.10.13 14:00:00 4: Calendar Kalender_home: Wakeup
2021.10.13 14:00:00 4: Calendar Kalender_home: Checking times...
2021.10.13 14:00:00 3: get Kalender_home events format:custom="$S" filter:uid=="blablablagooglecom" : TODO's
2021.10.13 14:58:06 4: Calendar Kalender_home: Wakeup
2021.10.13 14:58:06 4: Calendar Kalender_home: Updating...
2021.10.13 14:58:06 4: Calendar Kalender_home: Getting data from URL <hidden>
2021.10.13 14:58:06 5: Calendar Kalender_home: HTTP response code 200
2021.10.13 14:58:06 4: Calendar Kalender_home: parsing data asynchronously (PID= 3317)
2021.10.13 14:58:06 5: Calendar Kalender_home: control passed back to main loop.
2021.10.13 14:58:07 4: Calendar Kalender_home: got result from asynchronous parsing.
2021.10.13 14:58:07 4: Calendar Kalender_home: asynchronous parsing finished.
Can't use an undefined value as an ARRAY reference at ./FHEM/57_Calendar.pm line 2901.

Die Kalender updates gehen oft stundenlang problemlos ... irgendwann crashts dann ohne einen erkennbaren Zusammenhang mit irgendwas (Kalenderevent, Uhrzeit, ...)

mumpitzstuff

Kannst du den Fehler vielleicht hier mit einem entsprechenden Betreff posten?

https://forum.fhem.de/index.php/board,85.0.html

Wetterhexe

ja natürlich ... ich laß mal ein paar Tage laufen um sicherzugehen daß es wirklich das Problem ist ;)