Ubuntu 100% CPU und FHEM ohne Reaktion

Begonnen von no_Legend, 10 April 2018, 08:26:41

Vorheriges Thema - Nächstes Thema

no_Legend

Hallo Leute,

ich komm leider nicht weiter.
Bin mit meinem Latein am Ende.
Ich konnte das Problem nicht mal eingrenzen.

Mir schmiert FHEM mindestens einmal am Tag ab.
Und zwar so, dass ich den NUC Neustarten muss.
Top Zeigt, dass Perl bei 100% CPU liegt.
Der NUC ist allerdings noch ansprechbar per SSH keine Zugriffsprobleme.

Ubuntu und FHEM sind aktuell.

Im Ubuntu Log kann ich nichts wirklich finden.

Ich konnte das Problem nicht mal eingrenzen.
Auf Global ein verlose 5 zu setzten, lasst das Filelog recht schnell auf mehre GByte anschwellen.

Jemand ne Idee, wie ich am besten vorgehen kann/soll?
Kann ich den Event Monitor so lang nebenbei laufen lass, bis FHEM nicht mehr weiter macht?

Danke und Gruß Robert
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

Must Du wirklich Den rechner, oder nur FHEM neu starten?

Probiere bitte erstmal, ob Du manuell FHEM wiederbeleben kannst:
Stichworte:
service fhem stop
kill #fhem-pid#
kill -9 #fhem-pid#

Zusätzlich währe für uns eine ps ausgabe sehr interessant:
ps aux | grep [f]hem

Was hast DU für Module am laufen?
....
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

NecDd



Zitat von: no_Legend am 10 April 2018, 08:26:41
lasst das Filelog recht schnell auf mehre GByte anschwellen.


Deshalb...
You should make the file logs per day like:

/log/TS/TS_ABCD/TS-ABCD-%Y-%m-%d.log

If course, in my example is also an different folder as default.

If in one day your log file is 10+MB, than you probably have one problem with one of the modules. Find that module that generate so much log, find why, correct if it is an error, otherwise try an appropriate method with an different module.

Sent from my ONEPLUS A5010 using Tapatalk


helmut

Zitat von: no_Legend am 10 April 2018, 08:26:41
Top Zeigt, dass Perl bei 100% CPU liegt.
Der NUC ist allerdings noch ansprechbar per SSH keine Zugriffsprobleme.

Hallo Robert,

hilft Dir das freezemon-Modul einen Verdaechtigen zu finden?

Gruss Helmut
Intelligenz ist die Fähigkeit, Arbeit zu vermeiden, aber dafür zu sorgen, daß die Arbeit gemacht wird.
(Linus Torvalds)

no_Legend

Danke für eure Antworten.
Hier meine Antworten:

Zitat von: Wernieman am 10 April 2018, 08:41:03
service fhem stop
kill #fhem-pid#
kill -9 #fhem-pid#

Zusätzlich währe für uns eine ps ausgabe sehr interessant:
ps aux | grep [f]hem

Was hast DU für Module am laufen?
....

FHEM per Service zu stoppen funktioniert nicht.
Die Kills habe ich noch nicht ausprobiert.
ps aux ist wohl sinnvoll sobald hem wieder hängt?

Mach ich beides sobald es wieder so weit ist?

Das mit den Modulen ist ne echt lange List.
FHEM, Netatmo, Whiting, Xiaomi, HomeConnect, ESP, OBIS, Yeelight usw.
Gibt es ein Listing und die Verwendeten Module auszulesen?

Zitat von: NecDd am 10 April 2018, 08:57:43

Deshalb...
You should make the file logs per day like:

/log/TS/TS_ABCD/TS-ABCD-%Y-%m-%d.log

If course, in my example is also an different folder as default.

If in one day your log file is 10+MB, than you probably have one problem with one of the modules. Find that module that generate so much log, find why, correct if it is an error, otherwise try an appropriate method with an different module.

Sent from my ONEPLUS A5010 using Tapatalk

If I set verbose on 5 everything will be logged.
I run several module.
So also a log by day is to big, so collect all messages.


Zitat von: helmut am 10 April 2018, 09:02:08
Hallo Robert,

hilft Dir das freezemon-Modul einen Verdaechtigen zu finden?

Gruss Helmut

Hallo Helmut,
hatte ich am laufen, aber irgendwie nix wirklich gefunden.

Gruß Robert
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

helmut

Kannst Du vielleicht mit apptime sehen, ob sich etwas ankuendigt?

Gruss Helmut
Intelligenz ist die Fähigkeit, Arbeit zu vermeiden, aber dafür zu sorgen, daß die Arbeit gemacht wird.
(Linus Torvalds)

no_Legend

Zitat von: helmut am 10 April 2018, 10:35:32
Kannst Du vielleicht mit apptime sehen, ob sich etwas ankuendigt?

Gruss Helmut

Auf was soll ich genau achten?

Gruß Robert


Gesendet von iPad mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

Du kannst per "ps aux | grep fhem" sehen, ob fhem langsam immer mehr CPU braucht.

Bevor man einen Unix-Rechner rebootet versucht man immer vorher die Problemfälle "abzuschießen". Einen service "runterfahren" ist da nur der erste Schritt.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

helmut

Zitat von: Wernieman am 10 April 2018, 11:38:55
Du kannst per "ps aux | grep fhem" sehen, ob fhem langsam immer mehr CPU braucht.
Das, Werner, war auch meine Idee dabei.

Zitat von: Wernieman am 10 April 2018, 11:38:55
Bevor man einen Unix-Rechner rebootet versucht man immer vorher die Problemfälle "abzuschießen". Einen service "runterfahren" ist da nur der erste Schritt.
ACK.

@Robert: Ich wuerde mit den Sortierungen "apptime max" und "apptime total" anfangen. Das
Ganze mehrfach um zu sehen, ob und was sich auffaellig aendert.

Wenn es da keine Auffaelligkeiten gibt, passiert das "Abschmieren" zu einem festen Zeitpunkt
oder zu unterschiedlichen?Was findest Du am Ende des Logfiles? Wird das bis zum zwangsweisen
Beenden weitergeschrieben oder ist der Uebeltaeter eventuell im Umfeld des Logdateiendes zu
finden?

Gruss Helmut
Intelligenz ist die Fähigkeit, Arbeit zu vermeiden, aber dafür zu sorgen, daß die Arbeit gemacht wird.
(Linus Torvalds)

Wernieman

Und da es immer wieder vergessen wird:
Hast DU genug Speicherplatz frei?
df -h
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

stebar_

Mein FHEM hatte gestern das selbe Problem. FHEM konnte ich nicht mehr per Konsole herunterfahren, kill im Terminal hatte auch keine Auswirkungen. Reboot hat es vermutlich gelöst. Habe mir die log angeschaut, war aber nichts aufregendes drin.

Wernieman

- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

no_Legend

Zitat von: Wernieman am 11 April 2018, 09:13:20
Auch ein "kill -9" probiert?


Bei mir habe ich auch beides probiert
Kein kill funktionierte.
Es kam immer die Meldung PID konnte nicht gefunden werden.

Der letzte Log Eintrag war bei mir um 00:12
Als letze hat sich im log Netatmo gezeigt.
Ich werde das Modul jetzt mal deaktivieren und schauen ob es das war.

Ps aux lieferte folgendes:

fhem     20914  1.3  2.4 327576 196328 ?       S    11:47   0:16 perl fhem.pl fhem.cfg
fhem     20914  1.3  2.4 327576 196328 ?       S    11:47   0:16 perl fhem.pl fhem.cfg
fhem     20914  1.3  2.4 327576 196328 ?       S    11:47   0:17 perl fhem.pl fhem.cfg
fhem     20914  1.2  2.4 327576 196328 ?       S    11:47   0:17 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.4 332020 200512 ?       S    11:47   0:49 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.4 332020 200512 ?       S    11:47   0:58 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.4 332020 200512 ?       S    11:47   1:00 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:24 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:24 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:24 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:25 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.7 364228 218592 ?       S    11:47   1:55 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:59 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.7 364228 218592 ?       S    11:47   2:03 perl fhem.pl fhem.cfg
fhem     20914  1.7  2.7 364228 218608 ?       S    11:47   3:02 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218608 ?       S    11:47   3:45 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218608 ?       S    11:47   5:16 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218608 ?       S    11:47   6:07 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218668 ?       S    11:47   6:48 perl fhem.pl fhem.cfg
fhem     31174  9.4  2.6 364228 213404 ?       SN   18:48   0:00 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218668 ?       S    11:47   6:49 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218668 ?       S    11:47   6:49 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   7:12 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   8:13 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   8:31 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   9:14 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   9:20 perl fhem.pl fhem.cfg
fhem     20914 36.7  2.7 364228 218728 ?       R    Apr10 428:04 perl fhem.pl fhem.cfg




Gesendet von iPad mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

ZitatPID konnte nicht gefunden werden.
Sorry aber dann hast Du die Falsche genommen.

Aber zu Deiner Ausgabe, bist Du Dir sicher, das die Anzeige so ist? Eigentlich ist die 2. Spalte die PID, da steht bei Dir fast nur "20914", was definitif so nicht sein darf.

Bitte gib mir mal folgendes:
ps aux | head -n1; ps aux | grep [f]hem

Und 2. Bitte mal ein:
pstree -a | grep [f]hem

Hinweis:
1. Bitte beides als root (oder sudo)
2. Wenn pstree nicht existiert, bitte psmisc installieren
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

no_Legend

Zitat von: Wernieman am 11 April 2018, 11:05:14
Sorry aber dann hast Du die Falsche genommen.

Aber zu Deiner Ausgabe, bist Du Dir sicher, das die Anzeige so ist? Eigentlich ist die 2. Spalte die PID, da steht bei Dir fast nur "20914", was definitif so nicht sein darf.

Bitte gib mir mal folgendes:
ps aux | head -n1; ps aux | grep [f]hem

Und 2. Bitte mal ein:
pstree -a | grep [f]hem

Hinweis:
1. Bitte beides als root (oder sudo)
2. Wenn pstree nicht existiert, bitte psmisc installieren

Die falsche PID habe ich nicht genommen, siehe Screenshot im Anhang.
Außer ich habe eine falsche Syntax genommen.

Hier die Ausgabe:
fhem      3722  1.4  2.1 302444 171740 ?       S    09:18   1:41 perl fhem.pl fhem.cfg
  |-perl fhem.pl fhem.cfg
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

rudolfkoenig

Ich wuerde "grep pid: /opt/fhem/log/fhem*.log" nehmen.
Und ein Geraet mit ordentlichen Bildschirm und Tastatur.

Wernieman

#16
Da sind Zeichen/Zeilen verlohrengegangen.

Nur mal als Beispiel, meine Ausgabe:
root@mimi:~# ps aux | head -n1; ps aux | grep [f]hem
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
fhem      1615  0.5  1.0 176792 84224 ?        S    Apr10   5:19 /usr/bin/perl fhem.pl fhem.cfg
fhem      1628  0.0  0.9 174968 77348 ?        S    Apr10   0:00 /usr/bin/perl fhem.pl fhem.cfg
fhem      1631  0.2  1.0 179364 81016 ?        S    Apr10   2:30 /usr/bin/perl fhem.pl fhem.cfg
fhem      1632  0.4  0.9 178936 80580 ?        S    Apr10   3:59 /usr/bin/perl fhem.pl fhem.cfg


Bezüglich zu PID mal etwas zum lesen:
https://de.wikipedia.org/wiki/Process_identifier

Ich glaube nicht, das diese Zahl die PID bei Dir ist, diese muß UNIC sein. Bei Dir hat aber alles die gleiche PID und damit .....
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

no_Legend

Zitat von: Wernieman am 11 April 2018, 12:29:33
Da sind Zeichen/Zeilen verlohrengegangen.

Nur mal als Beispiel, meine Ausgabe:
root@mimi:~# ps aux | head -n1; ps aux | grep [f]hem
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
fhem      1615  0.5  1.0 176792 84224 ?        S    Apr10   5:19 /usr/bin/perl fhem.pl fhem.cfg
fhem      1628  0.0  0.9 174968 77348 ?        S    Apr10   0:00 /usr/bin/perl fhem.pl fhem.cfg
fhem      1631  0.2  1.0 179364 81016 ?        S    Apr10   2:30 /usr/bin/perl fhem.pl fhem.cfg
fhem      1632  0.4  0.9 178936 80580 ?        S    Apr10   3:59 /usr/bin/perl fhem.pl fhem.cfg


Bezüglich zu PID mal etwas zum lesen:
https://de.wikipedia.org/wiki/Process_identifier

Ich glaube nicht, das diese Zahl die PID bei Dir ist, diese muß UNIC sein. Bei Dir hat aber alles die gleiche PID und damit .....


Da ist nichts verloren:

hs-server-admin@FhemNUC:~$ ps aux | head -n1; ps aux | grep [f]hem
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
fhem      1271  1.4  2.1 300500 170156 ?       S    11:15   1:05 perl fhem.pl fhem.cfg


Zitat von: rudolfkoenig am 11 April 2018, 11:54:40
Ich wuerde "grep pid: /opt/fhem/log/fhem*.log" nehmen.
Und ein Geraet mit ordentlichen Bildschirm und Tastatur.


Hier die Ausgabe der letzten Paar Zeilen.

/opt/fhem/log/fhem-2018-03.log:2018.03.31 13:04:04 0: Server started with 544 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:5198)
/opt/fhem/log/fhem-2018-04-10.log:2018.04.10 11:27:12 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:19490)
/opt/fhem/log/fhem-2018-04-10.log:2018.04.10 11:37:51 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:19889)
/opt/fhem/log/fhem-2018-04-10.log:2018.04.10 11:45:37 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:20811)
/opt/fhem/log/fhem-2018-04-10.log:2018.04.10 11:48:30 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:20914)
/opt/fhem/log/fhem-2018-04-11.log:2018.04.11 07:36:14 0: Server started with 529 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:932)
/opt/fhem/log/fhem-2018-04-11.log:2018.04.11 08:34:01 0: Server started with 529 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:949)
/opt/fhem/log/fhem-2018-04-11.log:2018.04.11 09:19:10 0: Server started with 529 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:3722)
/opt/fhem/log/fhem-2018-04-11.log:2018.04.11 11:14:15 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:7000)
/opt/fhem/log/fhem-2018-04-11.log:2018.04.11 11:15:54 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:1271)
/opt/fhem/log/fhem-2018-04.log:2018.04.04 16:30:11 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:17283)
/opt/fhem/log/fhem-2018-04.log:2018.04.05 06:47:12 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:930)
/opt/fhem/log/fhem-2018-04.log:2018.04.05 16:28:11 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:949)
/opt/fhem/log/fhem-2018-04.log:2018.04.05 16:47:47 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:3945)
/opt/fhem/log/fhem-2018-04.log:2018.04.06 07:05:10 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:937)
/opt/fhem/log/fhem-2018-04.log:2018.04.06 07:10:41 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:930)
/opt/fhem/log/fhem-2018-04.log:2018.04.06 16:39:43 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:494)
/opt/fhem/log/fhem-2018-04.log:2018.04.07 07:19:51 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:954)
/opt/fhem/log/fhem-2018-04.log:2018.04.07 18:42:07 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:31229)
/opt/fhem/log/fhem-2018-04.log:2018.04.08 07:31:27 0: Server started with 532 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:930)
/opt/fhem/log/fhem-2018-04.log:2018.04.08 10:54:04 0: Server started with 531 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:21780)
/opt/fhem/log/fhem-2018-04.log:2018.04.09 07:48:02 0: Server started with 528 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:947)
/opt/fhem/log/fhem-2018-04.log:2018.04.09 10:11:36 0: Server started with 528 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:953)
/opt/fhem/log/fhem-2018-04.log:2018.04.09 12:04:37 0: Server started with 528 defined entities (fhem.pl:16453/2018-03-20 perl:5.022001 os:linux user:fhem pid:979)
/opt/fhem/log/fhem-2018-04.log:2018.04.09 12:06:42 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:2161)
/opt/fhem/log/fhem-2018-04.log:2018.04.09 15:05:45 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:975)
/opt/fhem/log/fhem-2018-04.log:2018.04.09 17:27:13 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:999)
/opt/fhem/log/fhem-2018-04.log:2018.04.10 06:25:43 0: Server started with 528 defined entities (fhem.pl:16569/2018-04-08 perl:5.022001 os:linux user:fhem pid:969)
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

Also ist Deine PID 1271

Startest Du so häufig Dein FHEM neu? Heute schon 5 Mal??
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

no_Legend

Momentan scheint die PID 1271 zu sein.
5 mal kann schon sein.

Habe vorhin die eine Bridge deaktivieren wollen.
Allerdings ging disable nicht.
Muss die Bridge Löschen.
Die Bridge war die letzte die um 00:12 in das Logfile geschrieben hat.

Gruß Robert
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

no_Legend

Der letzte log Eintrag war von Netatmo.
Diese bridge hab ich nun erst mal gelöscht.

Gruß Robert


Gesendet von iPad mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

stebar_

Netatmo benutze ich auch, vielleicht gibt es da einen Zusammenhang

no_Legend

Zitat von: stebar_ am 11 April 2018, 16:48:15
Netatmo benutze ich auch, vielleicht gibt es da einen Zusammenhang

Ich bin mir da einfach nicht sicher.
Ist halt das letzte device wonach dann FHEM nicht mehr lief.
Wenn jetzt aber ein andere Modul device oder was auch immer schuld ist, aber nicht dazu kommt ins log zu schreiben bekomme ich das so nicht raus.

Ich hab mal ne pralles vom auf dem Mac eingerichtet.
Vll lass ich hier mal Netatmo laufen.
Mehr oder weniger habe hier da Schleich Setup

Ubuntu in aktuell FHEM in aktuel.


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

helmut

Zitat von: no_Legend am 11 April 2018, 09:16:41
Ps aux lieferte folgendes:

fhem     20914  1.3  2.4 327576 196328 ?       S    11:47   0:16 perl fhem.pl fhem.cfg
fhem     20914  1.3  2.4 327576 196328 ?       S    11:47   0:16 perl fhem.pl fhem.cfg
[...]
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   9:14 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   9:20 perl fhem.pl fhem.cfg
fhem     20914 36.7  2.7 364228 218728 ?       R    Apr10 428:04 perl fhem.pl fhem.cfg


Hallo Robert,

diese vielen, zum groessten Teil zeitgleich gestarteten Prozesse kommen mir merkwuerdig vor. Wenn ich
mich nicht verzaehlt habe, sind es 27 zusaetzliche. Gibt es die nach dem Loeschen des netatmo-Moduls
immer noch? Es liegt natuerlich an den von mir (nicht) benutzten Modulen, aber ich habe regelmaessig genau
einen fhem-Prozess.

Hier ging es zwar um Speicherverbrauch, aber vielleicht hilft Dir dieser Thread mit "blockinginfo" weiter:
https://forum.fhem.de/index.php/topic,73490.msg655691.html#msg655691

Gruss Helmut
Intelligenz ist die Fähigkeit, Arbeit zu vermeiden, aber dafür zu sorgen, daß die Arbeit gemacht wird.
(Linus Torvalds)

no_Legend

Hallo Helmut

Ich habe die Ausgabe von ps aux über eine längeren Zeitraum hin und wieder mal in eine Datei geschrieben.
Deshalb also auch die Latte an Einträgen.

Gruß Robert.


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

helmut

Hallo Robert,

dann war das also nur ein Missverstaendnis und wir sollten das Ergebnis des testweisen Loeschen des netatmo-Moduls abwarten.

Gruss Helmut
Intelligenz ist die Fähigkeit, Arbeit zu vermeiden, aber dafür zu sorgen, daß die Arbeit gemacht wird.
(Linus Torvalds)

Schlimbo

Da ich gelesen habe, dass du HomeConnect verwendest.
Vielleicht ist das eine Spur:
FHEM Blockiert mit aktuell home-connect modulen


no_Legend

 @Schlimbo
Danke.
Ich hab mich Mals bei HomeConnect ausgeloggt.  Dann schau ich mal.


Gesendet von iPad mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

Zitat von: no_Legend am 11 April 2018, 18:48:29
Ich habe die Ausgabe von ps aux über eine längeren Zeitraum hin und wieder mal in eine Datei geschrieben.
Deshalb also auch die Latte an Einträgen.

Tue mir bitte den gefallen und erkläre beim nächstenmal dieses. Zerbreche mir schon länger den Kopf, wieso bei Dir so viele Prozesse mit der gleichen PID ....
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

stebar_

Home Connect habe ich ebenfalls im Einsatz

no_Legend

Zitat von: Wernieman am 11 April 2018, 21:13:09
Tue mir bitte den gefallen und erkläre beim nächstenmal dieses. Zerbreche mir schon länger den Kopf, wieso bei Dir so viele Prozesse mit der gleichen PID ....

Sorry. Habe gedacht du siehst es an Hand der Prozess Laufzeit die immer wieder hoch geht.
Das nächste mal schreib ich was dazu

Ich wollte schauen ob der Speicher Verbrauch hoch geht.

Heute Nacht war wieder Schluss.
Letzter log Eintrag war gehen 00:16
Erzeugt von freezmon.
Ich hab nun homeconnect und die dazu gehörigen devices gelöscht.

Mich wundert der Zeitpunkt.
Scheint ja schon System zu haben.
Um die Uhrzeit hab ich allerdings nicht wirklich was am laufen.

Der nuc ist auch exklusiv für FHEM usw.

Gruß Robert


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

Freezmon ... hast Du den schon länger im Einsatz? Bei PIs gibt es, glaube ich, aktuell Probleme damit. Da musten einige Ihn löschen ...
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

no_Legend

Ja Freezmon läuft.
Allerdings hatte ich freezmon auch schon deaktiviert und FHEM crashed trotzdem.

Ist halt echt schwer bei so vielen Modulen den Schuldigen zu finden.


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

frank

hast du auch mal in die system logs geschaut, was da zum crashzeitpunkt steht?
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

no_Legend

Ja aber auch nichts wirklich gefunden.
Ich hab jetzt erst mal homeconnect gelöscht.

Sollte das auch nicht helfen werd ich morgen noch na alles durch Schauen.


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

hilde

Hallo zusammen,

ich habe mit erstaunlich großer Übereinstimmung exakt das gleiche Fehlerbild:


  • fhem reagiert nicht mehr im Webinterface und hängt bei 100% CPU auf einen Kern fest.
  • Das OS ist noch wunderbar per ssh erreichbar (Ubuntu 16.04 mit neuestem HWE, Intel NUC 2820).
  • Laut Statistik ist das keine allmähliche Entwicklung sondern steigt innerhalb von 5 Min. von Normalauslastung (~10%) auf 100% (enger als 5 min messe ich nicht).
  • Die Störung ist bis jetzt vermehrt auch gegen 00:16 aufgetreten und trat mindestens einmal am Tag auf. Wobei das System auch gerne mal ein paar Stunden bei 100% festhing, bevor ich gemerkt habe, dass es mal wieder "kaputt" ist.
  • freezemon hat mir nichts gebracht; hat nur dazu geführt, dass sich das OS wegen out-of-memory aufhängt. Innerhalb eines 5 Min. Messintervalls werden dabei zusätzlich ca. 7GB RAM und SWAP belegt. Ein ssh Login ist dann nicht mehr möglich (das System ist headless) -> harter Reset; freezemon Logs gibt es vom fraglichen Zeitpunkt trotzdem nicht
  • Der bei 100% CPU hängende fhem Prozess lässt sich nicht per "service fhem stop" stoppen. Killen geht nur per kill -9, allerdings bleiben dabei noch einige andere fhem prozesse übrig, sodass ich das System trotzdem für einen sauberen Ausgangszustand reboote.

Ich hatte auch schon einige Module in Verdacht, aber noch nichts gefunden. Werde jetzt auch mal die homeconnect Devices löschen und dann berichten.

Bin aber trotzdem schon etwas beruhig, dass es kein Einzelfall ist - Danke, no_Legend, dass Du mich auf den Thread hier aufmerksam gemacht hast  ;)

Wernieman

Zitatsodass ich das System trotzdem für einen sauberen Ausgangszustand reboote.
Das ist nicht nötig, Unix (Linux) <> Windows.

Einfach alle anderen fhem-Prozesse auch per "kill" oder "kill -9" abschießen.

Das FHEM nur auf einen Prozessor werkelt ist normal. FHEM selber ist schließlich singlethreaded, nur die "nonblocking" mOdule werden auf andere Kerne ausgelagert.

-> Es dürfte dann auch genau ein Modul sein, welche FHEM solche Probleme macht.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

hilde

Zitat von: Wernieman am 12 April 2018, 21:56:58
Das ist nicht nötig, Unix (Linux) <> Windows.

Einfach alle anderen fhem-Prozesse auch per "kill" oder "kill -9" abschießen.

Das FHEM nur auf einen Prozessor werkelt ist normal. FHEM selber ist schließlich singlethreaded, nur die "nonblocking" mOdule werden auf andere Kerne ausgelagert.

Klar soweit, ich mache das auch aus Faulheit. Der Reboot geht schnell und schadet auch nicht.

no_Legend

So heute Nacht ist FHEM ohne Absturz durch gelaufen.
Es sieht wohl nach homeconnect aus.
Netatmo hatte ich gestern Abend wieder aktiviert.

Gruß Robert


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

hilde

Ohne homeconnect lief es jetzt auch hier ohne Störung durch!  :)
Netatmo, Withings, Calendar sind zwar aktuell auch raus bei mir, aber die hatte ich vorher schon als Ursache ausgeschlossen.

Werde es trotzdem noch einen weiteren Tag beobachten, nach den Erfahrungen der letzten Tage will ich mich nicht zu früh freuen ;-)

no_Legend

Withings und netatmo haben keine Probleme.
Hab ich heute Nacht laufen gehabt.


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Beta-User

Server: HP-elitedesk@Debian 12, aktuelles FHEM@ConfigDB | CUL_HM (VCCU) | MQTT2: MiLight@ESP-GW, BT@OpenMQTTGw | MySensors: seriell, v.a. 2.3.1@RS485 | ZWave | ZigBee@deCONZ | SIGNALduino | MapleCUN | RHASSPY
svn: u.a MySensors, Weekday-&RandomTimer, Twilight,  div. attrTemplate-files

no_Legend

@Beta-User

Danke homeconnect bleibt nun erst mal gelöscht.
Bis es eine bugfix gibt


Gesendet von iPhone mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.