Ubuntu 100% CPU und FHEM ohne Reaktion

Begonnen von no_Legend, 10 April 2018, 08:26:41

Vorheriges Thema - Nächstes Thema

no_Legend

Hallo Leute,

ich komm leider nicht weiter.
Bin mit meinem Latein am Ende.
Ich konnte das Problem nicht mal eingrenzen.

Mir schmiert FHEM mindestens einmal am Tag ab.
Und zwar so, dass ich den NUC Neustarten muss.
Top Zeigt, dass Perl bei 100% CPU liegt.
Der NUC ist allerdings noch ansprechbar per SSH keine Zugriffsprobleme.

Ubuntu und FHEM sind aktuell.

Im Ubuntu Log kann ich nichts wirklich finden.

Ich konnte das Problem nicht mal eingrenzen.
Auf Global ein verlose 5 zu setzten, lasst das Filelog recht schnell auf mehre GByte anschwellen.

Jemand ne Idee, wie ich am besten vorgehen kann/soll?
Kann ich den Event Monitor so lang nebenbei laufen lass, bis FHEM nicht mehr weiter macht?

Danke und Gruß Robert
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

Must Du wirklich Den rechner, oder nur FHEM neu starten?

Probiere bitte erstmal, ob Du manuell FHEM wiederbeleben kannst:
Stichworte:
service fhem stop
kill #fhem-pid#
kill -9 #fhem-pid#

Zusätzlich währe für uns eine ps ausgabe sehr interessant:
ps aux | grep [f]hem

Was hast DU für Module am laufen?
....
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

NecDd



Zitat von: no_Legend am 10 April 2018, 08:26:41
lasst das Filelog recht schnell auf mehre GByte anschwellen.


Deshalb...
You should make the file logs per day like:

/log/TS/TS_ABCD/TS-ABCD-%Y-%m-%d.log

If course, in my example is also an different folder as default.

If in one day your log file is 10+MB, than you probably have one problem with one of the modules. Find that module that generate so much log, find why, correct if it is an error, otherwise try an appropriate method with an different module.

Sent from my ONEPLUS A5010 using Tapatalk


helmut

Zitat von: no_Legend am 10 April 2018, 08:26:41
Top Zeigt, dass Perl bei 100% CPU liegt.
Der NUC ist allerdings noch ansprechbar per SSH keine Zugriffsprobleme.

Hallo Robert,

hilft Dir das freezemon-Modul einen Verdaechtigen zu finden?

Gruss Helmut
Intelligenz ist die Fähigkeit, Arbeit zu vermeiden, aber dafür zu sorgen, daß die Arbeit gemacht wird.
(Linus Torvalds)

no_Legend

Danke für eure Antworten.
Hier meine Antworten:

Zitat von: Wernieman am 10 April 2018, 08:41:03
service fhem stop
kill #fhem-pid#
kill -9 #fhem-pid#

Zusätzlich währe für uns eine ps ausgabe sehr interessant:
ps aux | grep [f]hem

Was hast DU für Module am laufen?
....

FHEM per Service zu stoppen funktioniert nicht.
Die Kills habe ich noch nicht ausprobiert.
ps aux ist wohl sinnvoll sobald hem wieder hängt?

Mach ich beides sobald es wieder so weit ist?

Das mit den Modulen ist ne echt lange List.
FHEM, Netatmo, Whiting, Xiaomi, HomeConnect, ESP, OBIS, Yeelight usw.
Gibt es ein Listing und die Verwendeten Module auszulesen?

Zitat von: NecDd am 10 April 2018, 08:57:43

Deshalb...
You should make the file logs per day like:

/log/TS/TS_ABCD/TS-ABCD-%Y-%m-%d.log

If course, in my example is also an different folder as default.

If in one day your log file is 10+MB, than you probably have one problem with one of the modules. Find that module that generate so much log, find why, correct if it is an error, otherwise try an appropriate method with an different module.

Sent from my ONEPLUS A5010 using Tapatalk

If I set verbose on 5 everything will be logged.
I run several module.
So also a log by day is to big, so collect all messages.


Zitat von: helmut am 10 April 2018, 09:02:08
Hallo Robert,

hilft Dir das freezemon-Modul einen Verdaechtigen zu finden?

Gruss Helmut

Hallo Helmut,
hatte ich am laufen, aber irgendwie nix wirklich gefunden.

Gruß Robert
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

helmut

Kannst Du vielleicht mit apptime sehen, ob sich etwas ankuendigt?

Gruss Helmut
Intelligenz ist die Fähigkeit, Arbeit zu vermeiden, aber dafür zu sorgen, daß die Arbeit gemacht wird.
(Linus Torvalds)

no_Legend

Zitat von: helmut am 10 April 2018, 10:35:32
Kannst Du vielleicht mit apptime sehen, ob sich etwas ankuendigt?

Gruss Helmut

Auf was soll ich genau achten?

Gruß Robert


Gesendet von iPad mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

Du kannst per "ps aux | grep fhem" sehen, ob fhem langsam immer mehr CPU braucht.

Bevor man einen Unix-Rechner rebootet versucht man immer vorher die Problemfälle "abzuschießen". Einen service "runterfahren" ist da nur der erste Schritt.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

helmut

Zitat von: Wernieman am 10 April 2018, 11:38:55
Du kannst per "ps aux | grep fhem" sehen, ob fhem langsam immer mehr CPU braucht.
Das, Werner, war auch meine Idee dabei.

Zitat von: Wernieman am 10 April 2018, 11:38:55
Bevor man einen Unix-Rechner rebootet versucht man immer vorher die Problemfälle "abzuschießen". Einen service "runterfahren" ist da nur der erste Schritt.
ACK.

@Robert: Ich wuerde mit den Sortierungen "apptime max" und "apptime total" anfangen. Das
Ganze mehrfach um zu sehen, ob und was sich auffaellig aendert.

Wenn es da keine Auffaelligkeiten gibt, passiert das "Abschmieren" zu einem festen Zeitpunkt
oder zu unterschiedlichen?Was findest Du am Ende des Logfiles? Wird das bis zum zwangsweisen
Beenden weitergeschrieben oder ist der Uebeltaeter eventuell im Umfeld des Logdateiendes zu
finden?

Gruss Helmut
Intelligenz ist die Fähigkeit, Arbeit zu vermeiden, aber dafür zu sorgen, daß die Arbeit gemacht wird.
(Linus Torvalds)

Wernieman

Und da es immer wieder vergessen wird:
Hast DU genug Speicherplatz frei?
df -h
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

stebar_

Mein FHEM hatte gestern das selbe Problem. FHEM konnte ich nicht mehr per Konsole herunterfahren, kill im Terminal hatte auch keine Auswirkungen. Reboot hat es vermutlich gelöst. Habe mir die log angeschaut, war aber nichts aufregendes drin.

Wernieman

- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

no_Legend

Zitat von: Wernieman am 11 April 2018, 09:13:20
Auch ein "kill -9" probiert?


Bei mir habe ich auch beides probiert
Kein kill funktionierte.
Es kam immer die Meldung PID konnte nicht gefunden werden.

Der letzte Log Eintrag war bei mir um 00:12
Als letze hat sich im log Netatmo gezeigt.
Ich werde das Modul jetzt mal deaktivieren und schauen ob es das war.

Ps aux lieferte folgendes:

fhem     20914  1.3  2.4 327576 196328 ?       S    11:47   0:16 perl fhem.pl fhem.cfg
fhem     20914  1.3  2.4 327576 196328 ?       S    11:47   0:16 perl fhem.pl fhem.cfg
fhem     20914  1.3  2.4 327576 196328 ?       S    11:47   0:17 perl fhem.pl fhem.cfg
fhem     20914  1.2  2.4 327576 196328 ?       S    11:47   0:17 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.4 332020 200512 ?       S    11:47   0:49 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.4 332020 200512 ?       S    11:47   0:58 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.4 332020 200512 ?       S    11:47   1:00 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:24 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:24 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:24 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:25 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.7 364228 218592 ?       S    11:47   1:55 perl fhem.pl fhem.cfg
fhem     20914  1.5  2.7 364228 218592 ?       S    11:47   1:59 perl fhem.pl fhem.cfg
fhem     20914  1.4  2.7 364228 218592 ?       S    11:47   2:03 perl fhem.pl fhem.cfg
fhem     20914  1.7  2.7 364228 218608 ?       S    11:47   3:02 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218608 ?       S    11:47   3:45 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218608 ?       S    11:47   5:16 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218608 ?       S    11:47   6:07 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218668 ?       S    11:47   6:48 perl fhem.pl fhem.cfg
fhem     31174  9.4  2.6 364228 213404 ?       SN   18:48   0:00 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218668 ?       S    11:47   6:49 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218668 ?       S    11:47   6:49 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   7:12 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   8:13 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   8:31 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   9:14 perl fhem.pl fhem.cfg
fhem     20914  1.6  2.7 364228 218728 ?       S    11:47   9:20 perl fhem.pl fhem.cfg
fhem     20914 36.7  2.7 364228 218728 ?       R    Apr10 428:04 perl fhem.pl fhem.cfg




Gesendet von iPad mit Tapatalk Pro
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.

Wernieman

ZitatPID konnte nicht gefunden werden.
Sorry aber dann hast Du die Falsche genommen.

Aber zu Deiner Ausgabe, bist Du Dir sicher, das die Anzeige so ist? Eigentlich ist die 2. Spalte die PID, da steht bei Dir fast nur "20914", was definitif so nicht sein darf.

Bitte gib mir mal folgendes:
ps aux | head -n1; ps aux | grep [f]hem

Und 2. Bitte mal ein:
pstree -a | grep [f]hem

Hinweis:
1. Bitte beides als root (oder sudo)
2. Wenn pstree nicht existiert, bitte psmisc installieren
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

no_Legend

Zitat von: Wernieman am 11 April 2018, 11:05:14
Sorry aber dann hast Du die Falsche genommen.

Aber zu Deiner Ausgabe, bist Du Dir sicher, das die Anzeige so ist? Eigentlich ist die 2. Spalte die PID, da steht bei Dir fast nur "20914", was definitif so nicht sein darf.

Bitte gib mir mal folgendes:
ps aux | head -n1; ps aux | grep [f]hem

Und 2. Bitte mal ein:
pstree -a | grep [f]hem

Hinweis:
1. Bitte beides als root (oder sudo)
2. Wenn pstree nicht existiert, bitte psmisc installieren

Die falsche PID habe ich nicht genommen, siehe Screenshot im Anhang.
Außer ich habe eine falsche Syntax genommen.

Hier die Ausgabe:
fhem      3722  1.4  2.1 302444 171740 ?       S    09:18   1:41 perl fhem.pl fhem.cfg
  |-perl fhem.pl fhem.cfg
IntelNUC mit Ubuntu mit FHEM immer aktuell,2x HMLAN, CUL443, CUL868 -homekit/siri -tablet ui -homebridge
Device, diverse:
HM-SEC-KEY,HM-LC-BL1-FM,HM-SEC-SD,HM-Sen-DB-PCB,HM-Sec-RHS,HM-Sec-SC-2,HM-WDS10-TH-O,Harmony,Netamo, 433MHz Steckdosen uvm.