[gelöst] ZWave Mesh Netzwerkprobleme behoben

Begonnen von Klaus.A, 30 August 2020, 21:22:38

Vorheriges Thema - Nächstes Thema

Klaus.A

Hallo zusammen,

kein Problem, sondern kurzer Erfahrungsbericht wie ich gravierende ZWave Netzwerkprobleme vor einigen Tagen behoben habe. Vielleicht hilft der Tipp auch anderen ähnlichen Fällen.

Ausgangssituation:

Seit längerer Zeit hatte ich immer wieder Fehlermeldungen im FHEM Log mit der ZWave Kommunikation. Scheinbar hat zwar alles funktioniert, aber teilweise mit unschönen Verzögerungen. Die Meldungen waren folgende (nicht zusammen, für verschiedene Geräte, nicht immer reproduzierbar):


ERROR: cannot SEND_DATA to <Gerätename>: transmit queue overflow
ZWDongle_ProcessSendStack: no ACK, resending message <Daten>
ZWDongle_0 transmit NO_ACK for <Wert>, target <Gerätename>
ZWave: No ACK from <Gerädename> after 5s for sentset: <Daten>
ZWDongle_ProcessSendStack: no ACK, ...


Es war zunächst keine Systematik zu erkennen. Irgendwo war die Kommunikation blockiert. USB-Kabel getauscht, entsprechend geschirmtes Gehäuse für den Einplatinencomputer verwendet.
Der ZWave-Stick ist ein aktueller Aeotec, aktueller Softwarestand. Stick ersetzt, keine Besserung. FHEM und Betriebssystem (Armbian Stretch auf Cubietruck) alles aktuell.

Es sind fast alles ZWave-Plus Komponenten - bis auf zwei ältere Merten-Dimmer in UP-Dosen. Die Kombination von alten und neuen (Plus) Geräten ist nicht optimal, aber funktionsfähig. Das konnte nicht zu derartigen Fehlern führen. Und warum waren auch ZWave-Plus Komponenten betroffen?

Aufgefallen ist mir, das besonders der eine Merten-Dimmer oft kein ACK innerhalb von 5 Sekunden geliefert hat. Vielleicht hilft Excludieren und neu Anlernen?

UP-Dose geöffnet, Inhalt genau betrachtet, Anlerntaste gesucht. Ach ja, könnte die Lage der "Antenne" (ein kurzes Stück Draht am Dimmer) die Ursache sein? Einen Versuch ist es wert, den Draht etwas anders zu legen. Da ging es nur um ein paar Millimeter.

Ergebnis und große Überraschung: Die kleine Änderung hatte große Wirkung. Seit der Änderung (ohne neu Anlernen) läuft das gesamte (!) ZWave Netz bei mir ohne jeden Fehler. Was war passiert?

Der Dimmer ist ein Routing Slave. Aber er hat oft keine Bestätigung zurück geschickt. Durch die Verzögerung haben auch alle Routen, die über diesen Dimmer gelaufen sind, nicht immer zufriedenstellend funktioniert. Daher kam es zu Meldungen, das z.B. ein SendStack Overflow für ein anderes ZWave-Gerät gemeldet wurde - obwohl dieses andere Gerät 100% in Ordnung war.

OK, ich weiß, man sollte besser ein reines ZWave-Plus Netz aufbauen. Historisch gewachsene Strukturen sind nun mal da und ein Austausch ist machbar aber in dem Fall aufwendig (Verkabelung wäre anders). Es zeigt sich das scheinbare Softwareprobleme ganz andere unerwartete Ursachen haben können. An die "Antenne" hatte ich ursprünglich überhaupt nicht gedacht.

Eine andere Sache ist noch in der Prüfung: Der Cubietruck mit Armbian Stretch hatte mit weiterem Ausbau der FHEM-Installation (besonders ZWave) wieder zu Hängern und damit Watchdog-Reboots tendiert. Einmal pro Woche, zuletzt auch 2 x pro Tag. Als Ursache war eindeutig ZWave-Kommunikation auszumachen. Es sah nach meiner Einschätzung so aus das es Probleme auf dem USB-Bus gab. Ich habe zwei Cubietrucks im Einsatz, einer ohne USB-Geräte (da läuft ioBroker) und einer mit dem USB-Stick (FHEM). Nur der mit dem USB-ZWave Stick hatte Probleme, der andere lief monatelang fehlerfrei.

Auch hier, kein ZWave Problem! Nach bisherigen Testläufen scheint die dynamische Taktung der CPU die Ursache gewesen zu sein. Standardmäßig wird "on demand" getaktet mit Frequenzen zwischen 480 und 960 MHz. In ruhigen Zeiten, wenn plötzlich Last auf das System kam (viele ZWave Aktionen hintereinander) war das Problem da. Nach meiner Vermutung war der Takt zu gering, das System ist nicht rechtzeitig zur notwendigen Leistung hochgefahren bzw. der USB-Bus wurde möglicherweise abgeschaltet. Im OS Log war nichts zu erkennen, mit dem Reboot war der letzte Teil immer verloren. Seit der neuen Einstellung in der Armbian Config mit CPU-Governor "performance" und 912/912 läuft das gesamte System wesentlich flüssiger und stabiler - bis jetzt keine Hänger mehr. Das ist noch weiter zu beobachten und falls die Änderung erfolgreich ist stelle ich einen Beitrag in der Abteilung "Einplatinencomputer" rein. Das passt dann dort besser. Hier nur als Hinweis wegen der USB-Bus Probleme die für ZWave tödlich waren. Evtl. könnten auch Timing-Probleme in Cubietruck Bauteilen die Ursache gewesen sein, wobei die dynamische Taktung dann zeitweise zu gering und in anderen Fällen zu hoch (Übertaktung) gewesen sein kann.

Auch hier zeigt sich: Scheinbare ZWave Probleme können irreführend sein.

Gruß, Klaus
2 x CubieTruck mit 1) FHEM 5.9 und 2) IOBroker-mit Echo-Dot/Alexa und Homekit-/Siri-Integration. 1 x HMLAN, 3 x HM-LGW-O-TW-W-EU-2, mehr als 90 HomeMatic Sensoren und Aktoren, Velux-Fenster-IF, Fibaro ZWave-Sensoren und Aktoren, Philips Hue Bridge, IRTrans IR-Konverter, AutoMower via API

rudolfkoenig


tux75at

Das kann ich bestätigen.

Ich hab viele Fibaro Devices im Einsatz, alles neue Geräte und alles plus Geräte, in einem Neubau.
In Betrieb ging alles Ende letzten Jahres. Ein Gerät hat einfach nicht funktioniert und ein paar Andere sporadisch auch nicht, oder nicht so wie sie sollte.
Nachdem ich die FHEM Zentrale aus dem Büro in den Technikraum verlegt habe und alles neu angelernt hatte, funktioniert alles.

Der große Unterschied: Das problematische Device hat eine sehr kurze Strecke zum Stick (UZB1) und die sporadisch nicht funktionierenden haben auch, höchstwahrscheinlich, eine direkte Verbindung, sie lagen alle im "Schatten" des problematischen Gerätes.
Eventuell wäre ein anders legen der Antenne so wie bei dir auch erfolgreich gewesen. Da die Zentrale sowieso verlegt werden musste und das Problem dadurch gelöst ist, kann es bei mir auch nur die Funkstrecke gewesen sein.
Position in Bezug zu den Wänden (Stahlbeton) spielt auch eine große Rolle. Den Stick habe ich mit einer aktiven USB Verlängerung 5m vom Rechner entfernt positioniert, was auch wichtig ist und jeder tun sollte, nicht nur bei einem Einplatinenrechner. Ein USB Kabel war bei mir vorher aber auch schon im System, kürzer und nicht aktiv, macht aber vermutlich keinen Unterschied.

krikan

Bei der Analyse von Netzwerkproblemen hilft ein UZB1 mit aktueller Firmware. In https://forum.fhem.de/index.php/topic,79893.msg829426.html#msg829426 hatte ich mal einen Patchentwurf für die Auswertung von Routendaten angehängt. Damit kann man bspw. feststellen, ob ein Gerät schon auf Protokollebene mehrfache Sendeversuche benötigt oder bspw. bei ZWavePlus-Geräten auf 9.6 kbps heruntergetaktet wird. Das sind tendienziell die problematischen Geräte. Eventuell hilft dann bereits ein Routenupdate; oder es sind Änderungen an Position/Antenne oder gar GErätetausch notwendig. Die Routendatenanalyse des Patches setzt schon früher an, als das was wir derzeit in FHEM sehen: nämlich nur NO ACK und Co.

Aber ich komme seit längerem zeitlich nicht dazu den Patch, der bei mir immer noch so in Betrieb ist, zu vollenden. Vielleicht hat jemand Zeit/Lust das Thema zu Ende zu führen, damit das in FHEM eingebaut werden kann.

Gruß, Christian