FHEM Forum

FHEM => Anfängerfragen => Thema gestartet von: antonwinden am 29 April 2016, 13:38:55

Titel: Fhem bleibt stehen...
Beitrag von: antonwinden am 29 April 2016, 13:38:55
Hallo, Hab seit 2 Wochen massive Probleme mit Fhem. Angefangen hat es seitdem das KNX modul dazu gekommen ist (fällt in die Zeit  also vermute ich das mal) hat sich Fhem unregelmäßig verabschiedet ohne eine Fehlermeldung und auch ohne das der raspi abgetürzt wäre.
Hab dann alles auf KNX umgestellt und EIB in rente geschickt - funktioniert auch alles halt nur meistens ein paar Stunden und dann steht wieder alles.
wenn ich "top" in der shell eingebe dann ist fhem einfach nicht mehr da aber bei
sudo service fhem status
steht running dort. abhilfe ist sudo service fhem stop und sudo service fhem start (ohne vorheriges stop funktioniert es nicht...)

hab jetzt mal stacktrace und verbose auf 3 gestellt und das log bringt immer vor dem absturz (bzw stehenbleiben)
2016.04.29 12:28:40 3: stacktrace:
2016.04.29 12:28:40 3:     main::__ANON__                      called by (eval 1385) (1)
2016.04.29 12:28:40 3:     (eval)                              called by ./FHEM/98_DOIF.pm (928)
2016.04.29 12:28:40 3:     main::DOIF_CheckCond                called by ./FHEM/98_DOIF.pm (1176)
2016.04.29 12:28:40 3:     main::DOIF_Trigger                  called by ./FHEM/98_DOIF.pm (1284)
2016.04.29 12:28:40 3:     main::DOIF_Notify                   called by fhem.pl (3164)
2016.04.29 12:28:40 3:     main::CallFn                        called by fhem.pl (3086)
2016.04.29 12:28:40 3:     main::DoTrigger                     called by fhem.pl (3404)
2016.04.29 12:28:40 3:     main::Dispatch                      called by ./FHEM/00_TUL.pm (267)
2016.04.29 12:28:40 3:     main::TUL_Parse                     called by ./FHEM/00_TUL.pm (248)
2016.04.29 12:28:40 3:     main::TUL_Read                      called by fhem.pl (3164)
2016.04.29 12:28:40 3:     main::CallFn                        called by fhem.pl (658)
2016.04.29 12:28:40 1: PERL WARNING: Argument "37969.92 lux" isn't numeric in numeric gt (>) at (eval 1385) line 1.
2016.04.29 12:28:40 3: stacktrace:
2016.04.29 12:28:40 3:     main::__ANON__                      called by (eval 1385) (1)
2016.04.29 12:28:40 3:     (eval)                              called by ./FHEM/98_DOIF.pm (928)
2016.04.29 12:28:40 3:     main::DOIF_CheckCond                called by ./FHEM/98_DOIF.pm (1176)
2016.04.29 12:28:40 3:     main::DOIF_Trigger                  called by ./FHEM/98_DOIF.pm (1284)
2016.04.29 12:28:40 3:     main::DOIF_Notify                   called by fhem.pl (3164)
2016.04.29 12:28:40 3:     main::CallFn                        called by fhem.pl (3086)
2016.04.29 12:28:40 3:     main::DoTrigger                     called by fhem.pl (3404)
2016.04.29 12:28:40 3:     main::Dispatch                      called by ./FHEM/00_TUL.pm (267)
2016.04.29 12:28:40 3:     main::TUL_Parse                     called by ./FHEM/00_TUL.pm (248)
2016.04.29 12:28:40 3:     main::TUL_Read                      called by fhem.pl (3164)
2016.04.29 12:28:40 3:     main::CallFn                        called by fhem.pl (658)
2016.04.29 12:43:12 1: ALARM signal, blocking write?
timed-out

nachdem hier aber der zeitliche abstand doch länger ist wird der stacktrace nicht sehr aussagekräftig sein.
wie find ich raus was schief läuft? Vorher ist das ganze seit 2 jahren ohne probleme gelaufen.
hab es auf einen anderen raspi probiert -> gleiches problem
neu aufgesetzt mit jessie und knxd, mit jessie und eibd, mit backup einspielen und nur mit cfg's ohne alte daten.

was kann ich machen um auf den fehler drauf zu kommen?
gruß anton
Titel: Antw:Fhem bleibt stehen...
Beitrag von: KölnSolar am 29 April 2016, 18:46:05
genau nicht abgestürzt, sondern "hängen" geblieben. Deshalb restart mit erst stop und dann start. Als letztes sehe ich im Log ein "Blocking write"  :o

Lass doch mal den Eventmonitor mitlaufen und Du siehst zumindest das letzte Event vor/zum(?) Zeitpunkt Absturz. Und dann mal mit verbose 5 loggen ?
Grüße Markus
Titel: Antw:Fhem bleibt stehen...
Beitrag von: antonwinden am 30 April 2016, 09:01:39
nachdem es jetzt 1 tag ohne hänger gelaufen ist hab ich meine vantage wetterstation im verdacht. da dürfte das ip interface den geist aufgegeben haben und liefert keine daten (komplett tot anscheinend) mehr.
hab jetzt das define dafür raus genommen und jetzt läuft es. mal schauen ob es das war...
danke anton

das mit verbose 5 und event monitor hab ich auch schon gemacht. nur waren da keine wiederholbaren fehler zu finden außer den üblichen warnungen wie ist keine zahl usw. und die letzte meldung im log war "time out" und keine passende meldung im event monitor