Ubuntu 100% CPU und FHEM ohne Reaktion

Begonnen von no_Legend, 10 April 2018, 08:26:41

Vorheriges Thema - Nächstes Thema

stebar_

Home Connect habe ich ebenfalls im Einsatz

no_Legend

Zitat von: Wernieman am 11 April 2018, 21:13:09
Tue mir bitte den gefallen und erkläre beim nächstenmal dieses. Zerbreche mir schon länger den Kopf, wieso bei Dir so viele Prozesse mit der gleichen PID ....

Sorry. Habe gedacht du siehst es an Hand der Prozess Laufzeit die immer wieder hoch geht.
Das nächste mal schreib ich was dazu

Ich wollte schauen ob der Speicher Verbrauch hoch geht.

Heute Nacht war wieder Schluss.
Letzter log Eintrag war gehen 00:16
Erzeugt von freezmon.
Ich hab nun homeconnect und die dazu gehörigen devices gelöscht.

Mich wundert der Zeitpunkt.
Scheint ja schon System zu haben.
Um die Uhrzeit hab ich allerdings nicht wirklich was am laufen.

Der nuc ist auch exklusiv für FHEM usw.

Gruß Robert


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

Freezmon ... hast Du den schon länger im Einsatz? Bei PIs gibt es, glaube ich, aktuell Probleme damit. Da musten einige Ihn löschen ...
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

no_Legend

Ja Freezmon läuft.
Allerdings hatte ich freezmon auch schon deaktiviert und FHEM crashed trotzdem.

Ist halt echt schwer bei so vielen Modulen den Schuldigen zu finden.


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

frank

hast du auch mal in die system logs geschaut, was da zum crashzeitpunkt steht?
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

no_Legend

Ja aber auch nichts wirklich gefunden.
Ich hab jetzt erst mal homeconnect gelöscht.

Sollte das auch nicht helfen werd ich morgen noch na alles durch Schauen.


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

hilde

Hallo zusammen,

ich habe mit erstaunlich großer Übereinstimmung exakt das gleiche Fehlerbild:


  • fhem reagiert nicht mehr im Webinterface und hängt bei 100% CPU auf einen Kern fest.
  • Das OS ist noch wunderbar per ssh erreichbar (Ubuntu 16.04 mit neuestem HWE, Intel NUC 2820).
  • Laut Statistik ist das keine allmähliche Entwicklung sondern steigt innerhalb von 5 Min. von Normalauslastung (~10%) auf 100% (enger als 5 min messe ich nicht).
  • Die Störung ist bis jetzt vermehrt auch gegen 00:16 aufgetreten und trat mindestens einmal am Tag auf. Wobei das System auch gerne mal ein paar Stunden bei 100% festhing, bevor ich gemerkt habe, dass es mal wieder "kaputt" ist.
  • freezemon hat mir nichts gebracht; hat nur dazu geführt, dass sich das OS wegen out-of-memory aufhängt. Innerhalb eines 5 Min. Messintervalls werden dabei zusätzlich ca. 7GB RAM und SWAP belegt. Ein ssh Login ist dann nicht mehr möglich (das System ist headless) -> harter Reset; freezemon Logs gibt es vom fraglichen Zeitpunkt trotzdem nicht
  • Der bei 100% CPU hängende fhem Prozess lässt sich nicht per "service fhem stop" stoppen. Killen geht nur per kill -9, allerdings bleiben dabei noch einige andere fhem prozesse übrig, sodass ich das System trotzdem für einen sauberen Ausgangszustand reboote.

Ich hatte auch schon einige Module in Verdacht, aber noch nichts gefunden. Werde jetzt auch mal die homeconnect Devices löschen und dann berichten.

Bin aber trotzdem schon etwas beruhig, dass es kein Einzelfall ist - Danke, no_Legend, dass Du mich auf den Thread hier aufmerksam gemacht hast  ;)

Wernieman

Zitatsodass ich das System trotzdem für einen sauberen Ausgangszustand reboote.
Das ist nicht nötig, Unix (Linux) <> Windows.

Einfach alle anderen fhem-Prozesse auch per "kill" oder "kill -9" abschießen.

Das FHEM nur auf einen Prozessor werkelt ist normal. FHEM selber ist schließlich singlethreaded, nur die "nonblocking" mOdule werden auf andere Kerne ausgelagert.

-> Es dürfte dann auch genau ein Modul sein, welche FHEM solche Probleme macht.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

hilde

Zitat von: Wernieman am 12 April 2018, 21:56:58
Das ist nicht nötig, Unix (Linux) <> Windows.

Einfach alle anderen fhem-Prozesse auch per "kill" oder "kill -9" abschießen.

Das FHEM nur auf einen Prozessor werkelt ist normal. FHEM selber ist schließlich singlethreaded, nur die "nonblocking" mOdule werden auf andere Kerne ausgelagert.

Klar soweit, ich mache das auch aus Faulheit. Der Reboot geht schnell und schadet auch nicht.

no_Legend

So heute Nacht ist FHEM ohne Absturz durch gelaufen.
Es sieht wohl nach homeconnect aus.
Netatmo hatte ich gestern Abend wieder aktiviert.

Gruß Robert


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

hilde

Ohne homeconnect lief es jetzt auch hier ohne Störung durch!  :)
Netatmo, Withings, Calendar sind zwar aktuell auch raus bei mir, aber die hatte ich vorher schon als Ursache ausgeschlossen.

Werde es trotzdem noch einen weiteren Tag beobachten, nach den Erfahrungen der letzten Tage will ich mich nicht zu früh freuen ;-)

no_Legend

Withings und netatmo haben keine Probleme.
Hab ich heute Nacht laufen gehabt.


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Beta-User

Server: HP-elitedesk@Debian 12, aktuelles FHEM@ConfigDB | CUL_HM (VCCU) | MQTT2: MiLight@ESP-GW, BT@OpenMQTTGw | MySensors: seriell, v.a. 2.3.1@RS485 | ZWave | ZigBee@deCONZ | SIGNALduino | MapleCUN | RHASSPY
svn: u.a MySensors, Weekday-&RandomTimer, Twilight,  div. attrTemplate-files

no_Legend

@Beta-User

Danke homeconnect bleibt nun erst mal gelöscht.
Bis es eine bugfix gibt


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.