fhem.pl 99% CPU

Begonnen von schka17, 09 April 2013, 18:11:11

Vorheriges Thema - Nächstes Thema

schka17

Hallo nochmal,

Ich wollte hier nur meine Ergebnisse mitteilen. Nach vielen Nächten der Fehlersuche habe ich eindeutig OWServer als Fehlerursache identifizieren können. Ist auch reproduzierbar, also wenn ich den Raspberry mit owfs stoppe oder vom Netz abstecke dann steht der zentrale raspberry , bzw hängt fhem mit 99%.

Das bedeutet die ganze ow verkabelung umbauen und direkt am zentralen Raspberry anstecken, das wollte ich mir ersparen. Hat aber auch was gutes, ein raspberry weniger, eine mögliche fehlerquelle weniger.

Lg karl
M: Thinclient x64 Debian | CUL FS20, HMS100WD, HMS100TF, HMS100T, HMS100CO, S300, S555TH | OWServer DS1420, DS18B20, DS2408 | RFXCOM UVN128, THWR800, THGR228N,RTGR328, PCR800 |Jeelink PCA301 EC3000|CUNO+IR|HMLAN|HMUSB|CUL433 Somfy|mySensors|espEasy
S1:Raspberry mit BPM810, Jeelink EC3000

Rohan

Hallo Karl,

Zitat von: schka17 schrieb am Mo, 20 Mai 2013 17:58... habe ich eindeutig OWServer als Fehlerursache identifizieren können. ...

Du hast aber auch geschrieben:

Zitat... da ich den remote owserver über ein relativ dürftige wanverbindung connected habe ...

Ich möchte das Augenmerk auf die "dürftige wanverbindung" richten, welche wohl eher eine W-LAN-Verbindung ist.

Also "eindeutig" und "Ursache" ist für mich etwas anderes, vor allem, da ein Remote-RPi mit 1-Wire und OWServer auf dem Zentral-System hier nun seit mehreren "30-Stunden-Perioden" klaglos seine Dienste verrichtet.

Aber egal ...

Gruß
Thomas


Fhem auf Mini-ITX mit Celeron 2-Core, HMLAN (> 55 Devices), CUL (FS20 und EM), RFXtrx 433E, Arduino (einige DS18B20), RPi mit 1-Wire (DS2423 für S0-Signale, DS18B20+), RPi/Arduino mit MQ-5 und MQ-9 (CO- und CNG/LPG-Sensor), CO-20 IAQ Sensor

justme1968

meine beiden raspberry pi mit remote owfs laufen seit 50 bzw. 60 tagen ohne probleme. der eine über lan der andere über wlan.

diverse an und aus schalten und andere unterbrechungen zu den beiden beim um- und einbau hat der fhem server hat alle ohne probleme überlebt.

gruss
  andre
hue, tradfri, alexa-fhem, homebridge-fhem, LightScene, readingsGroup, ...

https://github.com/sponsors/justme-1968

schka17

Nach vielen versuchen habe ich nun das problem eindeutig identifiziert und wollte die Ergebnisse hier noch einmal posten, vielleicht hilft es jemand der das selbe Problem hat.

Aber der Reihe nach, ich habe als erstes die onewire verkabelung umgebaut und habe alles, also owfs und OWServer alles lokal auf einem Raspberry laufen lassen.
Das Ergebnis war dass kein kompletter Freeze mehr auftrat, sondern der Freeze nur mehr etwa12-17 minuten gedauert hat, danach lief alles wieder normal. Blöderweise kam das relativ oft vor, und sehr oft auch dann wenn verschieden automatisierte Prozesse ablaufen sollten die dann halt eben um genau diese paar minuten später abliefen.
Im logfile waren dann auch timeouts beim Abfragen vom OWDevice zu sehen. Aber scheinbar liegt das Problem eher beim owfs daemon.
Ist bei mir auch reproduzierbar, wenn ich owfs stoppe steht FHEM ab dem Moment wo die OWDevices gepollt werden.
Ich habe dann ein bischen herumgespielt, pollingcycle verlängert ->problem trat seltener auf, sensoren reduziert -> Problem trat noch seltener auf.

Nun habe ich mal OWServer komplett disabled, seither läuft FHEM stabil, mit deutlich niedriger Systemauslastung und niedrigerer Systemtemperatur. Auch die häufigen HMLan disconnects sind weg, zumindest bis auf die nachvollziehbaren wie z.b.beim Backup.

Mein Fazit, ich werde einen Raspberry nur für die onewire komponenten einsetzen, alles lokal instlalliert. Die messwerte dann in den zentralen FHEM server übermitteln. Wenn dieser dann ab und zu mal für ein paar Minuten keine Werte liefert ist das zu verkraften, aber die zentrale automatisierung muss funktionieren.

Auf jeden Fall dank an alle die versucht haben zu helfen

Gruss

Karl
M: Thinclient x64 Debian | CUL FS20, HMS100WD, HMS100TF, HMS100T, HMS100CO, S300, S555TH | OWServer DS1420, DS18B20, DS2408 | RFXCOM UVN128, THWR800, THGR228N,RTGR328, PCR800 |Jeelink PCA301 EC3000|CUNO+IR|HMLAN|HMUSB|CUL433 Somfy|mySensors|espEasy
S1:Raspberry mit BPM810, Jeelink EC3000