Hauptmenü

Fhem bleibt stehen...

Begonnen von antonwinden, 29 April 2016, 13:38:55

Vorheriges Thema - Nächstes Thema

antonwinden

Hallo, Hab seit 2 Wochen massive Probleme mit Fhem. Angefangen hat es seitdem das KNX modul dazu gekommen ist (fällt in die Zeit  also vermute ich das mal) hat sich Fhem unregelmäßig verabschiedet ohne eine Fehlermeldung und auch ohne das der raspi abgetürzt wäre.
Hab dann alles auf KNX umgestellt und EIB in rente geschickt - funktioniert auch alles halt nur meistens ein paar Stunden und dann steht wieder alles.
wenn ich "top" in der shell eingebe dann ist fhem einfach nicht mehr da aber bei
sudo service fhem status
steht running dort. abhilfe ist sudo service fhem stop und sudo service fhem start (ohne vorheriges stop funktioniert es nicht...)

hab jetzt mal stacktrace und verbose auf 3 gestellt und das log bringt immer vor dem absturz (bzw stehenbleiben)
2016.04.29 12:28:40 3: stacktrace:
2016.04.29 12:28:40 3:     main::__ANON__                      called by (eval 1385) (1)
2016.04.29 12:28:40 3:     (eval)                              called by ./FHEM/98_DOIF.pm (928)
2016.04.29 12:28:40 3:     main::DOIF_CheckCond                called by ./FHEM/98_DOIF.pm (1176)
2016.04.29 12:28:40 3:     main::DOIF_Trigger                  called by ./FHEM/98_DOIF.pm (1284)
2016.04.29 12:28:40 3:     main::DOIF_Notify                   called by fhem.pl (3164)
2016.04.29 12:28:40 3:     main::CallFn                        called by fhem.pl (3086)
2016.04.29 12:28:40 3:     main::DoTrigger                     called by fhem.pl (3404)
2016.04.29 12:28:40 3:     main::Dispatch                      called by ./FHEM/00_TUL.pm (267)
2016.04.29 12:28:40 3:     main::TUL_Parse                     called by ./FHEM/00_TUL.pm (248)
2016.04.29 12:28:40 3:     main::TUL_Read                      called by fhem.pl (3164)
2016.04.29 12:28:40 3:     main::CallFn                        called by fhem.pl (658)
2016.04.29 12:28:40 1: PERL WARNING: Argument "37969.92 lux" isn't numeric in numeric gt (>) at (eval 1385) line 1.
2016.04.29 12:28:40 3: stacktrace:
2016.04.29 12:28:40 3:     main::__ANON__                      called by (eval 1385) (1)
2016.04.29 12:28:40 3:     (eval)                              called by ./FHEM/98_DOIF.pm (928)
2016.04.29 12:28:40 3:     main::DOIF_CheckCond                called by ./FHEM/98_DOIF.pm (1176)
2016.04.29 12:28:40 3:     main::DOIF_Trigger                  called by ./FHEM/98_DOIF.pm (1284)
2016.04.29 12:28:40 3:     main::DOIF_Notify                   called by fhem.pl (3164)
2016.04.29 12:28:40 3:     main::CallFn                        called by fhem.pl (3086)
2016.04.29 12:28:40 3:     main::DoTrigger                     called by fhem.pl (3404)
2016.04.29 12:28:40 3:     main::Dispatch                      called by ./FHEM/00_TUL.pm (267)
2016.04.29 12:28:40 3:     main::TUL_Parse                     called by ./FHEM/00_TUL.pm (248)
2016.04.29 12:28:40 3:     main::TUL_Read                      called by fhem.pl (3164)
2016.04.29 12:28:40 3:     main::CallFn                        called by fhem.pl (658)
2016.04.29 12:43:12 1: ALARM signal, blocking write?
timed-out

nachdem hier aber der zeitliche abstand doch länger ist wird der stacktrace nicht sehr aussagekräftig sein.
wie find ich raus was schief läuft? Vorher ist das ganze seit 2 jahren ohne probleme gelaufen.
hab es auf einen anderen raspi probiert -> gleiches problem
neu aufgesetzt mit jessie und knxd, mit jessie und eibd, mit backup einspielen und nur mit cfg's ohne alte daten.

was kann ich machen um auf den fehler drauf zu kommen?
gruß anton
KNX, Raspberry, Denon 3313, Philips TV, Xtrend9X00 und viel Optimismus...

KölnSolar

genau nicht abgestürzt, sondern "hängen" geblieben. Deshalb restart mit erst stop und dann start. Als letztes sehe ich im Log ein "Blocking write"  :o

Lass doch mal den Eventmonitor mitlaufen und Du siehst zumindest das letzte Event vor/zum(?) Zeitpunkt Absturz. Und dann mal mit verbose 5 loggen ?
Grüße Markus
RPi3/2 buster/stretch-SamsungAV_E/N-RFXTRX-IT-RSL-NC5462-Oregon-CUL433-GT-TMBBQ-01e-CUL868-FS20-EMGZ-1W(GPIO)-DS18B20-CO2-USBRS232-USBRS422-Betty_Boop-EchoDot-OBIS(Easymeter-Q3/EMH-KW8)-PCA301(S'duino)-Deebot(mqtt2)-zigbee2mqtt

antonwinden

nachdem es jetzt 1 tag ohne hänger gelaufen ist hab ich meine vantage wetterstation im verdacht. da dürfte das ip interface den geist aufgegeben haben und liefert keine daten (komplett tot anscheinend) mehr.
hab jetzt das define dafür raus genommen und jetzt läuft es. mal schauen ob es das war...
danke anton

das mit verbose 5 und event monitor hab ich auch schon gemacht. nur waren da keine wiederholbaren fehler zu finden außer den üblichen warnungen wie ist keine zahl usw. und die letzte meldung im log war "time out" und keine passende meldung im event monitor
KNX, Raspberry, Denon 3313, Philips TV, Xtrend9X00 und viel Optimismus...