Warum beendet sich FHEM immer mal wieder ? - Jemand anders auch betroffen ?

Begonnen von Stargazer, 22 Mai 2017, 20:53:45

Vorheriges Thema - Nächstes Thema

Stargazer

Hallo Gemeinde,

ich nutze FHEM nun schon seit über 2 Jahren mit diversen HomeMatic - Komponenten.
Anfangs hatte ich 2 Raspberry's am laufen. Einer für die Wohnung, der andere für unsere Energiesparte.
Seit ca. 3 Monaten habe ich das System umgestellt. Es läuft jetzt auf einem Lüfterlosen Mini-PC mit Windows 7 als Host-System mit nun 2 virtuellen Maschinen und FHEM drauf. Das VM-System ist VMWare Workstation Pro. Als Server nutze ich Ubuntu 16.04 LTS.

Das ganze läuft verdammt gut und schnittig.

Doch bei beiden Systemen, sprich, den Raspi's und jetzt auch bei den VM's, tauchte es immer nach einer Zeit auf, dass sich FHEM einfach beendet. Ohne irgendwelche Einträge im log oder sonst irgendwas. Ich dachte erst, dass es etwas mit dem Speicher zu tun hatte. Doch das ist nicht wirklich nachweislich.

Dann hatte ich das Update unserer FritzBox in Verdacht. Bin da eine Version zurück gegangen. Ohne Erfolg.

Auch hatte ich erst den Verdacht, dass etwas mit dem WLAN meines Handy's zu tun haben könnte, da ich Abstürze beobachten konnte, wenn ich mit dem Handy unser Netzwerk betreten oder verlassen habe. Doch nach dem Umstieg auf die VM's und Update auf Version 5.8 war es erst komplett weg. Obwohl ich mit dem Handy wieder ganz normal per WLAN unterwegs war. Also schied das auch aus.

Auch gibt es keine Zeitfenster, wo es sich weghängt. Es kann mal 2 mal pro Tag sein, dann aber kann es sein, das es 2 Tage so läuft, ohne sich zu beenden.

Habt ihr das auch bei euren Systemen ?

Woran könnte es liegen ?

Viele Grüße

André

viegener

Also ich denke die meisten werden ein solches problem nicht haben, das würdest Du sonst hier lesen.

Wenn es wirklich keinerlei Log-einträge gibt, ist es auf vermutlich nicht ganz einfach das einzukreisen.

Wenn es auf verschiedenen Plattformen passiert ist es vermutlich kein Problem des darunterliegenden Systems.

Zum Eingrenzen, würde ich erstmal  empfehlen loglevel global auf 4 (oder wenn nötig sogar auf 5) zu setzen.
Ausserdem könntest Du einzelne Devicetypen deaktivieren (also alle HM-devices / alle notifies etc)


Kein Support über PM - Anfragen gerne im Forum - Damit auch andere profitieren und helfen können

Otto123

Hallo André,
Zitat von: Stargazer am 22 Mai 2017, 20:53:45
Habt ihr das auch bei euren Systemen ?
absolut nicht!
Bei mir laufen derzeit 6 Systeme, die beende alle ich, sonst laufen die ewig durch.  ;)
Ist der Service wirklich beendet? Oder ist FHEM nur nicht erreichbar?

Gruß Otto
Viele Grüße aus Leipzig  ⇉  nächster Stammtisch an der Lindennaundorfer Mühle
RaspberryPi B B+ B2 B3 B3+ ZeroW,HMLAN,HMUART,Homematic,Fritz!Box 7590,WRT3200ACS-OpenWrt,Sonos,VU+,Arduino nano,ESP8266,MQTT,Zigbee,deconz

Stargazer

Hi viegener !

das ist ja das komische.
Es ist nix verändert worden, während der Umstellung von Raspi auf VM.

Ich hatte hier mal einen Beitrag gefunden, wo jemand auch so ein Problem hatte.
Da wurde es dann mit einem Skript im Crontab gelöst, welches bei einem beenden des FHEM Servers diesen neu startet.
Ich muss da nochmal genau gucken. Ich hatte das nämlich auch umgestezt. Muss aber wohl im Crontab -e nochmals den User ändern.

Komisch ist auch, dass meist erst der Energieserver anfängt, sporadisch auszusetzen, ein paar Tage später folgt meist der Server für die Wohnung.

Alles seltsam...

Wenn ich unter /etc/init.d/fhem status aufrufe, kommt immer fhem is not running.
Es lässt sich dann sofort wieder mit dem start - Befehl starten und läuft.

VG

André

DeeSPe

Mittlerweile habe ich mehrere Hostsysteme durch.
Von Raspbian, über Debian auf Brix/VIVO und auch Debian in VM auf Virtual Box.
Solange nicht irgendein Modul, meist mein eigenes wg. Testsystem, FHEM herunterreißt laufen alle meine Systeme bisher sehr stabil. Das sich der FHEM Dienst einfach so verabschiedet habe ich noch nie erlebt.

Ich weiß, für Dich sind das keine guten News, aber wie viegener schon meint, man kann es leider nur Stück für Stück durch Abschalten potentieller Kandidaten versuchen zu klären.

Gruß
Dan
MAINTAINER: 22_HOMEMODE, 98_Hyperion, 98_FileLogConvert, 98_serviced

Als kleine Unterstützung für meine Programmierungen könnt ihr mir gerne einen Kaffee spendieren: https://buymeacoff.ee/DeeSPe

Otto123

Zitat von: Stargazer am 22 Mai 2017, 21:49:15
Da wurde es dann mit einem Skript im Crontab gelöst, welches bei einem beenden des FHEM Servers diesen neu startet.
Ich muss da nochmal genau gucken. Ich hatte das nämlich auch umgestezt. Muss aber wohl im Crontab -e nochmals den User ändern.
Sorry aber das ist mit Sicherheit der falsche Weg.

Da es ja mit Deiner FHEM Instanz mitwandert und beide Instanzen betroffen sind, muss es defacto an dem liegen was Du innerhalb von FHEM tust. Was ist bei beiden Instanzen gleich?

Gruß Otto
Viele Grüße aus Leipzig  ⇉  nächster Stammtisch an der Lindennaundorfer Mühle
RaspberryPi B B+ B2 B3 B3+ ZeroW,HMLAN,HMUART,Homematic,Fritz!Box 7590,WRT3200ACS-OpenWrt,Sonos,VU+,Arduino nano,ESP8266,MQTT,Zigbee,deconz

rudolfkoenig

Wenn FHEM ohne Warnung sich beendet, dann steht meist irgendetwas in der Console. In solchen Problemfaellen lohnt sich FHEM in screen mit  "attr global logfile -" zu starten, dann kann man sich spaeter zu diesem screen "attachen", und die letzte Meldung anschauen.

Btw. mein FHEM laeuft auch durch, ich kann mich in den letzten zehn Jahren an keinen unbeabsichtigten Stop mich erinnern (bis auf einem Motherbord-Defekt und ein Stromausfall).  Auf der anderen Seite bin ich aber sehr konservativ, was den Einsatz von FHEM-Modulen betrifft.

Otto123

mach doch einfach mal bei beiden ein fheminfo und poste das Ergebnis, dann können wir schauen ob es ein Modul gibt was wir nicht im Einsatz haben.

Gruß Otto
Viele Grüße aus Leipzig  ⇉  nächster Stammtisch an der Lindennaundorfer Mühle
RaspberryPi B B+ B2 B3 B3+ ZeroW,HMLAN,HMUART,Homematic,Fritz!Box 7590,WRT3200ACS-OpenWrt,Sonos,VU+,Arduino nano,ESP8266,MQTT,Zigbee,deconz

Stargazer

Okay,

hier mal das fheminfo zum Wohnungssystem:
Fhem info:
  Release  : 5.8 FeatureLevel: 5.8
  OS       : linux
  Arch     : i686-linux-gnu-thread-multi-64int
  Perl     : v5.22.1
  uniqueID : fcc36d02ec312b262d849e35ff1de8f3
  upTime   : 11:22:18

Defined modules:
  CALVIEW       : 1
  CUL_HM        : 70
  Calendar      : 1
  DOIF          : 6
  Dashboard     : 1
  FHEM2FHEM     : 1
  FHEMWEB       : 3
  FRITZBOX      : 1
  FileLog       : 10
  HMUARTLGW     : 1
  HTTPMOD       : 6
  PHTV          : 1
  SMAEM         : 1
  SMAInverter   : 1
  SVG           : 11
  TelegramBot   : 1
  VantagePro2   : 1
  alexa         : 1
  allowed       : 2
  at            : 3
  autocreate    : 1
  dummy         : 17
  eventTypes    : 1
  notify        : 50
  readingsGroup : 6
  telnet        : 1
  weblink       : 1

Defined models per module:
  CUL_HM        : ActionDetector,HM-CC-RT-DN,HM-ES-PMSw1-Pl,HM-LC-SW4-WM,HM-OU-CFM-PL,HM-PBI-4-FM,HM-SEC-MDIR-2,HM-SEC-SC-2,HM-SEC-SCo

Transmitting this information during an update: no
You can change this via the global attribute sendStatistics




Und hier zum Energiesystem:

Fhem info:
  Release  : 5.8 FeatureLevel: 5.8
  OS       : linux
  Arch     : i686-linux-gnu-thread-multi-64int
  Perl     : v5.22.1
  uniqueID : 1cbfc54b8db529de9af5ecab92963a1f
  upTime   : 02:23:31

Defined modules:
  DOIF                  : 3
  Dashboard             : 1
  ElectricityCalculator : 4
  FHEMWEB               : 3
  FileLog               : 6
  HTTPMOD               : 1
  SMAEM                 : 1
  SMAInverter           : 1
  SVG                   : 6
  VantagePro2           : 1
  Weather               : 1
  autocreate            : 1
  dummy                 : 6
  eventTypes            : 1
  notify                : 11
  readingsGroup         : 6
  telnet                : 1
  weblink               : 2

Transmitting this information during an update: no
You can change this via the global attribute sendStatistics


Das mit der Crontab - Geschichte finde ich auch keine Lösung. Ich möchte halt wissen, wo es weg kommt.
Da einfach mal Stück für Stück Ursachenforschung betreiben...

Viele Grüße und besten Dank

André



schka17

Ich kann nur sagen dass ich auch manchmal diese Problem habe bzw. hatte. Vor einiger Zeit war es definitiv ein Speicherproblem, also nicht HW sondern dass der perl Prozess immer mehr Speicher genutzt und nicht mehr freigegeben hat (cubieboard2 mir armbian). Nach einem Wechsel auf eine amd platform mit debian und 2GB Ram fuel dieses Problem weg. Jetzt passierts noch ab und zu dass im Logfile die Meldung "too many files open....." aber da läuft der prozess noch, fhemweb antwortet aber nicht mehr. Tja, und noch seltener wird Fhem ohne irgendeine Meldung im Logfile beendet. Workaround für mich ist das ich systemd verwende und fhem einfach wieder gestartet wird. Ich habe viel Zeit mit debugging verbracht und mittlerweile ist es mir zu aufwändig, also lebe ich jetzt mal mit dieser Situation.

Zur weiteren Information, das betrifft nur eine von mehreren Fhem Instanzen, leider die zentrale. Ich habe noch zwei sub-FHEM's  einedavon läuft bis auf die Updates die ich durchführe ohne Probleme auf einem Raspberry B (mit der ersten SD Karte) ohne Probleme


Sent from my iPad using Tapatalk
M: Thinclient x64 Debian | CUL FS20, HMS100WD, HMS100TF, HMS100T, HMS100CO, S300, S555TH | OWServer DS1420, DS18B20, DS2408 | RFXCOM UVN128, THWR800, THGR228N,RTGR328, PCR800 |Jeelink PCA301 EC3000|CUNO+IR|HMLAN|HMUSB|CUL433 Somfy|mySensors|espEasy
S1:Raspberry mit BPM810, Jeelink EC3000

Otto123

Hi André,

also mein Ergebnis -> eventuell eines von diesen Modulen:
  Dashboard             : 1
  SMAEM                 : 1
  SMAInverter           : 1
  VantagePro2           : 1
Die hast Du in beiden Instanzen und ich habe die nicht. Vielleicht brauchst Du die nicht zwingend in beiden Instanzen und nimmst sie in einer mal raus.

Mag ein schräger Ansatz sein, aber Versuch macht kluch  8)
Gruß Otto
Viele Grüße aus Leipzig  ⇉  nächster Stammtisch an der Lindennaundorfer Mühle
RaspberryPi B B+ B2 B3 B3+ ZeroW,HMLAN,HMUART,Homematic,Fritz!Box 7590,WRT3200ACS-OpenWrt,Sonos,VU+,Arduino nano,ESP8266,MQTT,Zigbee,deconz

Stargazer

Hallo Otto,

ich warte jetzt nochmal einen "Crash" ab. Was komisch ist, ist die Tatsache, dass die Wetterstation (Vantage Pro 2) sich dann auch mit weg hängt. Diese sendet ja an Davis die Daten, um sie später per App abrufen zu können. Muss mal gucken, ob ich das deaktivieren kann. War damals noch von vor der Einbindung in FHEM. Die Station kommt dann, nachdem so ein Crash auftrat, auch nicht wieder ins Netz. Auch per App steht dann alles (man sieht den Zeitstempel des letzten gesendeten Wertes). Hatte die Station jedoch seit gestern nach dem letzten Crash noch nicht wieder resettet, damit sie erstmal nicht im Netz war/ist.

Ich habe den VM's jeweils 1GB RAM mit 40GB HDD Platz und einen Prozessorkern spendiert. ich könnte beide noch auf 2 GB RAM hieven. Das sollte vom Hostsystem gut machbar sein.

VG

André

PS.: Als der letzte Beitrag geschrieben wurde, habe ich die Davis wieder ans Netz gelassen.
       Mal abwarten...

Stargazer

Ich habe gestern Abend nach dem letzten Post hier nochmal über Geschichte mit dem VantagePro Modul nachgedacht.
Das spontane beenden von FHEM gab es vorher auch schon. Da war die Station und das Modul noch nicht in Betrieb. Aber warum diese als einziger Client dann aus dem Intranet fliegt und erst wieder kommt, wenn ich kurz den Strom von der Wetterstation nehme, bleibt mir ein Rätsel.

VG

André

Wernieman

Ist fhem wirklich "weg" oder sagt dieses "nur" das Init-System?
ps aux | grep [f]hem

Auch interessant, währe zu der Ausfallzeit das kernlog. z.B. könnte es auch der oem-Killer sein ..
tail /var/log/kern.log
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Stargazer

Danke für die Antworten !

So. Der Energieserver hatte sich heute Vormittag wieder weg gehangen. Die App der Wetterstation zeigt auch, dass sich die Station um 6Uhr heute Morgen auch wieder ausgeklingt hat und keine Daten mehr sendet. Ich habe den Energieserver nun neu übers Init gestartet. Leider bevor ich die Antwort von Wernieman gelesen hatte. Ich habe jetzt dort auf dem Server die IP der Station geändert. Reicht das wohl für einen Test, oder muss ich das ganze Modul rausnehmen ? Also diese Geschichte mit dem Ethernetanschluss der Davis Wetterstation ist von Davis mehr wie rudimentär.

VG

André