[Gelöst] FHEM hängt sich nach einigen Stunden auf / stürzt ab

Begonnen von NehCoy, 28 Januar 2014, 07:51:48

Vorheriges Thema - Nächstes Thema

Wernieman

Und wie habt Ihr dann versucht, FHEM zu killen? Mit einem "normalen" kill, oder mit "kill -9"?

Wenn ein "normales" kill nicht funktioniert, ist es noch nicht sooo gravierend. Wenn ein -9 nicht funktioniert, dagegen ...
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

NehCoy

Ich habe den kompletten Raspberry neugestartet:
sudo reboot

Joachim

ZitatJain. Zwar mag jetzt die Spannungsversorgung die Ursache für das Aufhängen des TPUART USB Moduls und FHEM sein, aber war sagt, dass nicht ein anderes Ereignis ebenfalls dazu führt. Es ist doch noch nur gut, wenn FHEM so stabil läuft, dass es solche "Probleme" erkennt, meldet, protokolliert und "Gegenmaßnahmen" ergreift.
Zumindest sehe ich das so.
Wenn Du das so siehst, dann programmiere die entsprechenden Überwachungsmaßnahmen, und stelle sie der Allgemeinheit zur verfügung.

@ Wernieman,
Bei mir war FHEM im Status "D", und damit hat auch ein kill -9 nicht geholfen.

Gruß Joachim
FHEM aktuellste Version auf FB 7570 und 7390 mit Zebradem Toolbox Freetz
FHEM auf Raspberry
1-Wire mit LinkUSBi und Rs-Pi ds2482-800  1-Wire-9 Board; Max mit Cube, HMLAN
div. 1-Wire Sensoren; MAX-Thermostaten; Homematic-Komponenten, Zehnder KWL über RS-232

Puschel74

Hallo,

ZitatZwar mag jetzt die Spannungsversorgung die Ursache für das Aufhängen des TPUART USB Moduls und FHEM sein, aber war sagt, dass nicht ein anderes Ereignis ebenfalls dazu führt.

Dann sollte man doch bei den einfacheren Dingen anfangen und nicht gleich "Überwachungs- und Protokollierungsprogramme" erstellen.
Spannungsversorgung tauschen und einen aktiven USB-Hub dran und schauen was passiert.

Fehler weg?
Arbeit erledigt.

Fehler noch da?
Ok - weiter suchen was los ist/sein kann.

Grüße
Zotac BI323 als Server mit DBLog
CUNO für FHT80B, 3 HM-Lan per vCCU, RasPi mit CUL433 für Somfy-Rollo (F2F), RasPi mit I2C(LM75) (F2F), RasPi für Panstamp+Vegetronix +SONOS(F2F)
Ich beantworte keine Supportanfragen per PM! Bitte im Forum suchen oder einen Beitrag erstellen.

NehCoy

ZitatWenn Du das so siehst, dann programmiere die entsprechenden Überwachungsmaßnahmen, und stelle sie der Allgemeinheit zur verfügung.
Wenn mein Know-how soweit ist, gerne.
Ich muss allerdings erst mal anfangen Perl zu erlernen. Bis ich dann dazu kommen würde mich um solche Routinen zu kümmern vergeht also ein Weile.

ZitatSpannungsversorgung tauschen und einen aktiven USB-Hub dran und schauen was passiert.
Du meinst di Variante zwei von dem Artikel, den Joachim gepostet hat!?!
ttp://www.forum-raspberrypi.de/Thread-info-stromversorgung-raspberry-pi
Dazu muss ich erst mal "Shoppen" gehen...


Übrigens: Inzwischen ist das Fehlerbild wieder aufgetreten:
Der Befehl "ps aux | grep fhem" liefert folgendes Ergebnis:

pi@raspberrypi ~ $ ps aux | grep fhem
root      2562  0.0  0.1   1692   548 ?        Ss   08:13   0:07 startpar -f -- fhem
fhem      2747 90.5  2.6  14368 11868 ?        R    17:05 193:35 /usr/bin/perl fhem.pl fhem.cfg
pi        2832  0.0  0.1   3544   808 pts/2    S+   20:39   0:00 grep --color=auto fhem



Joachim

Bevor unnötig Geld ausgegeben wird!
Zitat@ all
bevor man sich irgendwelche neuen Netzteile kauft, kann man auch aus einem vorhandenen PC (Netzteil) die 5V abzweigen.
Wenn der Pi dann stabil rennt, dann Vernünftiges Netzteil für den Pi kaufen.
FHEM aktuellste Version auf FB 7570 und 7390 mit Zebradem Toolbox Freetz
FHEM auf Raspberry
1-Wire mit LinkUSBi und Rs-Pi ds2482-800  1-Wire-9 Board; Max mit Cube, HMLAN
div. 1-Wire Sensoren; MAX-Thermostaten; Homematic-Komponenten, Zehnder KWL über RS-232

Wernieman

Laut dem Listing "verbrät" fhem bein Dir 90.5% CPU time ... kannst Du mal gucken, ober die CPU überhaupt noch "Luft" hat?
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

NehCoy

Danke für eure Antworten!  :)

Zitat von: Joachim am 29 Januar 2014, 20:50:17
Bevor unnötig Geld ausgegeben wird!

Den Tipp hatte ich bereits gelesen. Aber ich habe nicht einfach so ein PC-Netzteil rumliegen.
Zudem wäre der Gesamtwirkungsgrad recht bescheiden.
Und -last but not least- sieht das im Wandschrank recht unschön aus! ;)

Zitat von: Wernieman am 29 Januar 2014, 21:06:52
Laut dem Listing "verbrät" fhem bein Dir 90.5% CPU time ... kannst Du mal gucken, ober die CPU überhaupt noch "Luft" hat?

Meinst du mit "Luft" freie Rechenkapazität, oder "Luft" bzgl. Überhitzung und Drosselung?
Letzteres glaube ich nicht, dass es ein Problem sein könnte.
Ersteres muss ich mal nach dem Linux-Befehl schauen, der mir die Gesamtresiurcenauslastung auflistet.
Wobei über 90% für mich irgendwie nach "aufhängen" und "Endlosschleife" riecht...

Wernieman

Hinweis:
Einfach mal "top" verwenden .... ich meinte die CPU-Auslastung

Edit:
oder das im Forum erweiterte SYSMON-Modul verwenden ...
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

NehCoy

ZitatEinfach mal "top" verwenden .... ich meinte die CPU-Auslastung

Also wenn sich FHEM nicht aufgehängt hat, liegt die durchschnittliche CPU-Last zwischen 1,5 und 2 %.
Somit sind über 98% Idle Time.

Der Befehl "ps aux | grep fhem" liefert mir eine CPU-Last von 0,1%.

Zitatoder das im Forum erweiterte SYSMON-Modul verwenden ...

Danke. Werde mich mal umschauen.

Wernieman

Interessant währe dann dagegen, wenn er sich "Aufhängt". Wenn dann in Summe die CPU-Last bei 100% ...
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

NehCoy

#26
Zitatdas im Forum erweiterte SYSMON-Modul verwenden ...

Meinst du das hier:
http://forum.fhem.de/index.php?topic=17201.0
:o
Wobei ich mich frage, was das helfen soll, da doch anscheinend die Darstellung über das Webfrontend erfolgt. Und das ist ja bekanntlich nicht mehr erreichbar.

ZitatInteressant währe dann dagegen, wenn er sich "Aufhängt". Wenn dann in Summe die CPU-Last bei 100% ...

War mir klar. ;) Liefere ich dann beim nächsten "Absturz" nach ...  ;D

NehCoy

Et voilà, hier sind die Ergebnisse.

pi@raspberrypi ~ $ ps aux | grep fhem
root 1750 0.0 0.1 1756 532 ? S Jan29 0:00 /bin/sh /etc/init.d/fhem start
fhem 1755 2.6 2.7 14616 12264 ? R Jan29 18:36 perl fhem.pl fhem.cfg
pi 2319 0.0 0.1 3548 864 pts/2 S+ 08:14 0:00 grep --color=auto fhem


Das Ergebnis von "top" als Screenshot als Analge zu diesem Beitrag.
Merkwürdig, dass über "top" eine CPU-Last von über 98% für FHEM angezeigt wird, aber über ps jetzt nur 2,6%.

Wernieman

SYSMON Protokolliert auch die Werte in einem Logfile, d.h. sie sind auch für die Vergangenheit einsehbar.

Wenn top und ps unterschiedliche Werte anzeige, könnte es daran liegen, das ps nur einen "Ist-Stand" zeigt, während top die letzten 5? sec? verwendet. Da praktisch nur fhem arbeitet und sonst nichts anderes (abgesehen von System mit 7,2%)

Er hängt nicht beim lesen/schreiben (da z.B. waiting = 0), hat aber auch keine Reserven mehr (idle=0) ... und Du kannst fhem wirklich nicht mehr beenden? auch mit "kill -9" nicht?
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

NehCoy

Zurück zur Spannungsversorgung:
Das Hauptproblem beider Versorgung über die Micro-USB Buchse ist doch die 1A-Sicherung.
Warum überbrückt man die nicht einfach. Dann kommt man schlussendlich beim gleichen raus, als würde man die normalen USB-A Ports verwenden...

Zitat... und Du kannst fhem wirklich nicht mehr beenden? auch mit "kill -9" nicht?

Kann ich nicht sagen, da noch nie getestet.
Soll ich dann lieber "kill -9 <id>" oder "killall -9 fhem" verwenden?