1Wire OWX Instabilität

Begonnen von hal2001, 03 Januar 2015, 20:37:35

Vorheriges Thema - Nächstes Thema

hal2001

Hallo zusammen und ein Frohes Neues Jahr,

ich setze FHEM bei mir seit knapp 2,5 Jahren ein. Ich bin über FS20/Homematic eingestiegen und habe mich vor 1,5 Jahren auch an 1Wire herangewagt. Leider läuft bei mir 1Wire nicht zufriedenstellend. Symptom: Teilweise nach Tagen oder auch nach Wochen erkennt OWX erst die 1W-Sensoren nicht mehr bis dann das FHEM-System ganz einfriert. Ich würde das gerne systematisch analysieren.

System: Ubuntu-Server (läuft seit ca. 8 Jahren ohne Unterbrechung). FHEM aktuelle Version (wöchentlich mit update-Funktion). 1W-Bus in linearer Topologie (ca. 40m lang, CAT6-Netzwerkkabel). Komponeten: 1x eService Buskoppler (galvanisch isoliert), 1x eService Hub II AC, 4x eService 8fach-Schaltmodul 230V, 16x DS1860-Temperatur-Sensoren. Der typische Intervallwert zur Abfrage der Temperatursensoren ist 300s. Das FHEM-System für 1W habe ich wegen der geringen Geschwindigkeit als separates System ausgelagert und mit FHEM2FHEM mit dem "Homematic-System" verknüpft.

Nach Tagen oder auch erst nach Wochen stürzt das System ohne besondere Ereignisse (alles in dem 1W-System ist über at/notify für Hiezungsmischer/Rolladen-Steuerung automatisiert, d.h. kein Anwender greift hier in das System manuell ein). Manchmal fallen erst alle 1W-Komponenten aus, d.h. werden über das FHEM-System nicht mehr gesteuert. Wenn ich dann noch in das FHEM-System komme und "get <OWX Buskoppler> devices" werden keine 1W-Komponenten mehr erkannt. Neben einem FHEM-Neustart muß ich immer den USB-Stecker der Buskopplers ziehen, um das System wieder ans Laufen zu bekommen.

Was kann ich machen, um den Fehler zu finden?

Danke vorab für die Unterstützung.

Jan

GiJoe73

Hi,

Hast du mal die Spannung an den Sensoren bzw. ganz hinten im Bus mal nachgemessen? Evtl. ist diese an der Grenze und je nach Last sinkt diese zu tief.
FHEM 5.5 auf Cubietruck mit 60GB SSD
HMLAN - CFG - Adapter
11 x HM-LC-Bl1PBU-FM
8 x HM-CC-RT-DN
2 x 1-Wire Bus mit 8 stk. DS2406, 3 x 1-Wire Dougie Counter, 2 x DS2408, 8 x DS18B20, 1 x DS2450, 2x DS2438

hal2001

Danke. Ja, habe die Spannung  (12V/5V) am Ende wie an jeder Komponente gemessen. Der SpannungsAbfall war jederzeit aus meiner Sicht marginal, d.h. <5%. Daran sollte es also nicht liegen,  oder sind 5% doch zuviel?

hexenmeister

Moin!
Ich setze 1wire schon länger ein. 2 Busse, ca. 10 und 50 Meter, etwa 20 DS18b20, 2x ds2480b-Controller, OWX_ASYNC. Abrageinterval: 1 Min, Onkick.
Ich hatte früher Instabilitätsprobleme, dann lief länger alles problemfrei. Seit paar Wochen fallen die Busse unregelmäßig einzeln oder beide aus und sind nur durch FHEM-Restart wieder zur Mitarbeit zu bewegen. Update mache ich regelmäßig, neue Versionen der OWX-Module gab es in dieser Zeit jedoh nicht.
get devices funktioniert jedoch immer einwandfrei, nur Werte kommen irgendwann nicht mehr. Meitens fällt längerer Bus aus. Evtl. gibt es Busstörungen, an den sich FHEM-Modul 'verschlückt'?
Wie auch immer, an einer Lösung wäre ich auch sehr interessiert.


det.

Hallo Hexenmeister,
Ich habe OWX auch schon sehr lange am Laufen und die verschiedenen Entwicklungsstufen vom asynchronen OWX mit getestet. Meine persönliche Erfahrung (nicht zu verallgemeinern und braucht auch hier nicht diskutiert werden) das asynchrone OWX läuft auf RPi prima, auf CubieTruck nicht über längere Zeit zufriedenstellend. Ich hab 4 Bussysteme mit synchronem OWX ohne Ausfälle auf 2 Cubie jetzt schon über Monate laufen.
LG
det.

hexenmeister

Hi!
Synchrone OWX hat in meiner Installation zu viele freezes verursacht. Asynchrone Version lief bis vor kurzem auch Monate lang problemlos auf meinem Cubietruck. :(

Tobias

Ich bin wegen der Instabilität vom owx weg,  hin zu einem ausgelagertem owserver auf einem raspi. Syncroner Modus. Läuft saustabil ohne merkliche freezes.

Gesendet von meinem ALCATEL ONE TOUCH 997D mit Tapatalk

Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

Prof. Dr. Peter Henning

OWX habe ich nun wirklich lange im Einsatz. Mit 3 (seit gestern 4) USB-Buskopplern, einem Ethernet-Buskoppler und einem WLAN-Buskoppler. Ich habe auf meinem Cubie2 weder freezes, noch Abstürze, noch Instabilitäten.

Das veröffentliche OWX-Backend stammt aus dem August 2014 und enthält diverse Änderungen von Norbert Truchsess. In meiner privaten Version sind diese zum großen Teil nicht drin (ich wollte erst einmal abwarten, bis Norbert seinen asynchronen Kram stabilisiert hat). Umgekehrt enthält meine Version diverse Änderungen, die in dem öffentlich verfügbaren Modul nicht drin sind. Die Gesamtzahl der Abweichungen ist jetzt laut Angabe meines entsprechenden Tools auf 1200 angewachsen. Mit anderen Worten: Da Norbert im Moment daran nicht mehr aktiv ist, werde ich die Überarbeitung demnächst mal angehen.

Schlussfolgerung hier: Wenn in den letzten Wochen Probleme auftreten, hat dies nichts mit den OWX-Modulen zu tun. Sondern entweder mit der Hardware (wahrscheinlich), mit dem FHEM-Kern (möglich, aber unwahrscheinlich) oder mit dem Betriebssystem (nach Update, möglich).

Spaßeshalber stelle ich im Anhang mal die von mir verwendete Version zum Testen zur Verfügung - bitte ausschließlich für Experten zum Testen. Vielleicht behebt das ja das eine oder andere Problem, denn manche der im veröffentlichen Modul zu findenden Dinge finde ich nicht so glücklich gleöst.

LG

pah

hexenmeister

Zitat von: Prof. Dr. Peter Henning am 04 Januar 2015, 16:26:35
Schlussfolgerung hier: Wenn in den letzten Wochen Probleme auftreten, hat dies nichts mit den OWX-Modulen zu tun. Sondern entweder mit der Hardware (wahrscheinlich), mit dem FHEM-Kern (möglich, aber unwahrscheinlich) oder mit dem Betriebssystem (nach Update, möglich).

Diese teile ich auch. Die Hardwareprobleme kann ich natürlich nicht ausschliessen, aber da gab es auch seit einer Ewigkeit keine Änderungen. Ich werde mir morgen meinen Außensensor ansehen, ich hatte schon mal mit dem Teil Probleme (Wasser bei einem Sturm reingelaufen, die Leiterbahnen waren stark angegriffen). Wegen FHEM-Kern kann ich mir auch keinen Reim machen, da gab es natürlich reichlich Anpassungen in der Zwischenzeit. Auch mit Betriebssystem - ich hatte in der Tat im fraglichen Zeitraum ein Update durchgeführt, könnte schon passen, aber warum?
Also ich verstehe das nicht und das stört mich  >:(

Danke für Deine Versionen, habe seit paar Stunden im Einsatz. Läuft zwar alles stabil, aber die Anzahl der freezes ist schon signofikant gestiegen. Immer mal wieder im Bereich von 1-1.5 Sekunden.

Auch bei apptime ist OWX in Top10 gestiegen:
fhem> apptime

                                name             function    max  count    total  average maxDly
                              HMLAN1           HMLAN_Read   1358    506    69313   136.98      0 HASH(HMLAN1)
               tmr-OWTHERM_GetValues      HASH(0x3317f20)   1192     42    46370  1104.05   1406 HASH(EG_HA_OWTS13.Warmwasser_Rueckfluss)
               tmr-OWTHERM_GetValues      HASH(0x331f7d0)   1192     43    47503  1104.72   3527 HASH(EG_HA_OWTS31.Kaltwasser_Anschluss)
               tmr-OWTHERM_GetValues      HASH(0x3321bd8)   1192      9    10191  1132.33   2707 HASH(EG_WC_OWTS01.Raum)
               tmr-OWTHERM_GetValues      HASH(0x3319d40)   1188     42    46447  1105.88    780 HASH(EG_HA_OWTS12.Warmwasser_Entnahme)
               tmr-OWTHERM_GetValues      HASH(0x331ba90)   1188     43    47562  1106.09   2109 HASH(EG_HA_OWTS23.Fernwaerme_Ruecklauf_Gesamt)
               tmr-OWTHERM_GetValues      HASH(0x331dde0)   1178     43    47457  1103.65   2196 HASH(EG_HA_OWTS25.Fernwaerme_Ruecklauf_Heizung)
               tmr-OWTHERM_GetValues      HASH(0x331e218)   1167     42    46419  1105.21    771 HASH(EG_HA_OWTS21.Fernwaerme_Vorlauf_Heizung)
               tmr-OWTHERM_GetValues      HASH(0x33247f8)   1162      9    10170  1130.00   4077 HASH(UM_VH_OWTS01.Luft)
               tmr-OWTHERM_GetValues      HASH(0x33151c8)   1159     42    46357  1103.74   1224 HASH(EG_HA_OWTS11.Warmwasser_Speicher)
               tmr-OWTHERM_GetValues      HASH(0x33194b8)   1159     42    46371  1104.07    390 HASH(EG_HA_OWTS10.Warmwasser_Speicher_Oben)
               tmr-OWTHERM_GetValues      HASH(0x331bc70)   1152     43    47404  1102.42   2150 HASH(EG_HA_OWTS24.Fernwaerme_Ruecklauf_Warmwasser)
               tmr-OWTHERM_GetValues      HASH(0x30d6628)   1151      9    10006  1111.78   4102 HASH(NN_TE_OWTS01.1W_Controller_Box1)
               tmr-OWTHERM_GetValues      HASH(0x331e668)   1150     42    46328  1103.05   2070 HASH(EG_HA_OWTS22.Fernwaerme_Vorlauf_Warmwasser)
               tmr-OWTHERM_GetValues      HASH(0x3322430)   1148      9    10051  1116.78    175 HASH(DG_NN_OWTS01.Raum)
               tmr-OWTHERM_GetValues      HASH(0x3325f70)   1144      9     9930  1103.33    102 HASH(EG_FL_OWTS01.Raum)
               tmr-OWTHERM_GetValues      HASH(0x3320658)   1108      9     9891  1099.00    583 HASH(EG_HA_OWTS01.Raum_Oben)
               tmr-OWTHERM_GetValues      HASH(0x331b250)   1105      9     9880  1097.78     28 HASH(EG_GA_OWTS01.Raum)
                 tmr-Calendar_Wakeup      HASH(0x332bff0)    985      3     2562   854.00    252 HASH(GC)
                   tmr-SYSMON_Update      HASH(0x32c4a80)    772     43    26629   619.28    503 HASH(sysmon)


Alles noch eher unkritisch, aber asyncron wäre schon angenehmer.
Ich beobachte mal weiter. Nochmals danke!

Grüße,

Alexander

Prof. Dr. Peter Henning

Gestiegen ? Wieso das denn ?

Verstehe ich nicht.

LG

pah

hexenmeister

Naja, mit ASYNC war meitens SYSMON vorne und die OWTEMP hatte wesentlich niedrigere Werte. Ist ja auch klar, das wird ja nicht aktiv im Hauptthread gewartet.