Hallo, Hab seit 2 Wochen massive Probleme mit Fhem. Angefangen hat es seitdem das KNX modul dazu gekommen ist (fällt in die Zeit also vermute ich das mal) hat sich Fhem unregelmäßig verabschiedet ohne eine Fehlermeldung und auch ohne das der raspi abgetürzt wäre.
Hab dann alles auf KNX umgestellt und EIB in rente geschickt - funktioniert auch alles halt nur meistens ein paar Stunden und dann steht wieder alles.
wenn ich "top" in der shell eingebe dann ist fhem einfach nicht mehr da aber bei
sudo service fhem status
steht running dort. abhilfe ist sudo service fhem stop und sudo service fhem start (ohne vorheriges stop funktioniert es nicht...)
hab jetzt mal stacktrace und verbose auf 3 gestellt und das log bringt immer vor dem absturz (bzw stehenbleiben)
2016.04.29 12:28:40 3: stacktrace:
2016.04.29 12:28:40 3: main::__ANON__ called by (eval 1385) (1)
2016.04.29 12:28:40 3: (eval) called by ./FHEM/98_DOIF.pm (928)
2016.04.29 12:28:40 3: main::DOIF_CheckCond called by ./FHEM/98_DOIF.pm (1176)
2016.04.29 12:28:40 3: main::DOIF_Trigger called by ./FHEM/98_DOIF.pm (1284)
2016.04.29 12:28:40 3: main::DOIF_Notify called by fhem.pl (3164)
2016.04.29 12:28:40 3: main::CallFn called by fhem.pl (3086)
2016.04.29 12:28:40 3: main::DoTrigger called by fhem.pl (3404)
2016.04.29 12:28:40 3: main::Dispatch called by ./FHEM/00_TUL.pm (267)
2016.04.29 12:28:40 3: main::TUL_Parse called by ./FHEM/00_TUL.pm (248)
2016.04.29 12:28:40 3: main::TUL_Read called by fhem.pl (3164)
2016.04.29 12:28:40 3: main::CallFn called by fhem.pl (658)
2016.04.29 12:28:40 1: PERL WARNING: Argument "37969.92 lux" isn't numeric in numeric gt (>) at (eval 1385) line 1.
2016.04.29 12:28:40 3: stacktrace:
2016.04.29 12:28:40 3: main::__ANON__ called by (eval 1385) (1)
2016.04.29 12:28:40 3: (eval) called by ./FHEM/98_DOIF.pm (928)
2016.04.29 12:28:40 3: main::DOIF_CheckCond called by ./FHEM/98_DOIF.pm (1176)
2016.04.29 12:28:40 3: main::DOIF_Trigger called by ./FHEM/98_DOIF.pm (1284)
2016.04.29 12:28:40 3: main::DOIF_Notify called by fhem.pl (3164)
2016.04.29 12:28:40 3: main::CallFn called by fhem.pl (3086)
2016.04.29 12:28:40 3: main::DoTrigger called by fhem.pl (3404)
2016.04.29 12:28:40 3: main::Dispatch called by ./FHEM/00_TUL.pm (267)
2016.04.29 12:28:40 3: main::TUL_Parse called by ./FHEM/00_TUL.pm (248)
2016.04.29 12:28:40 3: main::TUL_Read called by fhem.pl (3164)
2016.04.29 12:28:40 3: main::CallFn called by fhem.pl (658)
2016.04.29 12:43:12 1: ALARM signal, blocking write?
timed-out
nachdem hier aber der zeitliche abstand doch länger ist wird der stacktrace nicht sehr aussagekräftig sein.
wie find ich raus was schief läuft? Vorher ist das ganze seit 2 jahren ohne probleme gelaufen.
hab es auf einen anderen raspi probiert -> gleiches problem
neu aufgesetzt mit jessie und knxd, mit jessie und eibd, mit backup einspielen und nur mit cfg's ohne alte daten.
was kann ich machen um auf den fehler drauf zu kommen?
gruß anton
genau nicht abgestürzt, sondern "hängen" geblieben. Deshalb restart mit erst stop und dann start. Als letztes sehe ich im Log ein "Blocking write" :o
Lass doch mal den Eventmonitor mitlaufen und Du siehst zumindest das letzte Event vor/zum(?) Zeitpunkt Absturz. Und dann mal mit verbose 5 loggen ?
Grüße Markus
nachdem es jetzt 1 tag ohne hänger gelaufen ist hab ich meine vantage wetterstation im verdacht. da dürfte das ip interface den geist aufgegeben haben und liefert keine daten (komplett tot anscheinend) mehr.
hab jetzt das define dafür raus genommen und jetzt läuft es. mal schauen ob es das war...
danke anton
das mit verbose 5 und event monitor hab ich auch schon gemacht. nur waren da keine wiederholbaren fehler zu finden außer den üblichen warnungen wie ist keine zahl usw. und die letzte meldung im log war "time out" und keine passende meldung im event monitor