Absturz ... oder auch nicht?

Begonnen von Det20, 29 September 2017, 07:59:38

Vorheriges Thema - Nächstes Thema

Det20

Hallo,

ich hatte heute früh ein recht komisches Problem. Ich wollte Tablet-UI aufrufen, es kam aber nur ".../www/tablet/index not found". FHEM selbst (:8083) lief fast ins leere, er hat also nur gerödelt, ohne dass eine Seite gekommen ist. CPU-Load vom FHEM Prozess war allerdings nur bei ca. 3,6%. Das Log-File war allerdings heftig. So ab 6:01 (da war noch niemand wach) läuft das Log im Millisekunden-Bereich voll:

Angefangen hat es mit (außschließlich):


2017.09.29 06:08:37 3: HttpUtils url=http://192.168.0.1/webservices/homeautoswitch.lua?sid=fe6a7c667b567bca&switchcmd=getdevicelistinfos
2017.09.29 06:08:37 3: http://192.168.0.1/webservices/homeautoswitch.lua?sid=fe6a7c667b567bca&switchcmd=getdevicelistinfos: HTTP response code 200
2017.09.29 06:08:37 3: HttpUtils http://192.168.0.1/webservices/homeautoswitch.lua?sid=fe6a7c667b567bca&switchcmd=getdevicelistinfos: Got data, length: 2355
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:41 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)
2017.09.29 06:08:43 1: Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)

usw.


Vor da ab also nur noch "Too many open files". Daraus wurde dann, so 15 Minuten später:


Accept failed (WEB: Too many open files)
Accept failed (telnetForBlockingFn_1506364121.0133: Too many open files)


Die Sensoren (Bewegungssensor) wurden nicht mehr bearbeitet, es wurde also bei Bewegung kein Licht mehr geschaltet. Habe jetzt den ganzen Pi neu gestartet und der Spuck ist vorbei. Aber was war das? Habe gestern kein Update gemacht, also nix geändert. SD-Karte ist neu, erst vor 2 Wochen gewechselt.

viegener

Such mal mit "Too many open files" in google

Generell ist das eine Betriebssystembegrenzung, die man auch erhöhen kann, wobei es wichtig ist herauszufinden, ob irgendetwas bei Dir läuft, dass unbegrenzt neue Dateihandles erzeugt (dann bringt auch das höhere Limit keine Lösung).

Achso: Auch Netzwerkverbindungen erzeugen Filehandles

Kein Support über PM - Anfragen gerne im Forum - Damit auch andere profitieren und helfen können

Det20

#2
Habe ich denn eine Chance herauszufinden, wer oder was die Fehler erzeugt? Müsste ja was inside FHEM sein, sonst würde es nicht im FHEM Log auftauchen.
Von außen kommt man, bis auf den 8083 (SSL), nicht auf den Pi, also kein Forwarding für Telnet oder so.

viegener

Missverständnis: Der Fehler kommt aus dem Betriebssystem - Es gibt einfach eine begrenzte Anzahl von Handles und irgendjemand (FHEM und andere) verwenden alle.

Stell Dir einen Parkplatz vor mit 30 Plätzen. Wenn der 31. kommt meldet er Parkplatz voll - ist aber nicht derjenige der den Parkplatz gefüllt hat  ;)

Genauso hier - FHEM meldet, dass es keinen weiteren Platz/Handle mehr bekommt vom Betriebssystem - es kann schon sein, dass irgendetwas in FHEM die Filehandles frisst, deshalb der Vorschlag dazu mal google zu befragen...
Kein Support über PM - Anfragen gerne im Forum - Damit auch andere profitieren und helfen können

Det20

Ok, verstanden. Dann werde ich mal auf die Suche gehen. Nach der Nadel im Heuhaufen.
Vielen Dank erstmal für die gute Erklärung.

kadettilac89

Zitat von: Det20 am 29 September 2017, 14:54:48
Ok, verstanden. Dann werde ich mal auf die Suche gehen. Nach der Nadel im Heuhaufen.
Vielen Dank erstmal für die gute Erklärung.
Schau mal im Syslog ob da mehr steht. Je nach Hardware und Betriebssystem... Raspbian unter /var/log

Gesendet von meinem SM-G925F mit Tapatalk