gelöst [DevIo/00_CUL] störung/ausfall der cul verbindung blieb unbemerkt

Begonnen von frank, 08 September 2022, 11:14:22

Vorheriges Thema - Nächstes Thema

frank

moin.

mein cul868 im homematic mode konnte scheinbar irgendwann nicht mehr mit fhem kommunizieren, was in 00_CUL aber leider nicht registriert wurde. der state war weiterhin auf initialized.

den ausfall des cul habe ich nur zufällig bemerkt, da es im fhem.log keine CUL_Parse einträge mehr gab, obwohl
beim cul zufällig verbose=5 gesetzt war. also keine "lebenszeichen" vom cul in fhem.

ab dem letzten CUL_Parse konnte ich dann auch erkennen, dass alle sendebefehle an den cul nicht mehr "on air" gingen, da weitere gateways diese funkmessages nun nicht mehr registrierten.
alle befehle an den cul wurden quasi ignoriert.

log ausschnitte vor und nach dem ausfall:
##### letzter fhem start vor dem ausfall
2022.08.24 13:03:57.868 3: Opening cul868 device /dev/serial/by-id/usb-busware.de_CUL868-if00
2022.08.24 13:03:57.924 3: Setting cul868 serial parameters to 38400,8,N,1
2022.08.24 13:03:58.033 3: cul868: Possible commands: BCFiAZEGMKURTVWXefmltux
2022.08.24 13:03:58.040 3: cul868 device opened
2022.08.24 13:03:58.047 2: Switched cul868 rfmode to HomeMatic


##### letzte 3 CUL_Parse einträge vor dem ausfall. besonderheit: der letzte eintrag ist eine kopie des dritt-letzten
2022.08.27 16:02:37.608 4: CUL_Parse: cul868 A 0B D7 A258 B2B2B2 1DFC2F 00FD2E -51
2022.08.27 16:02:37.610 5: cul868: dispatch A0BD7A258B2B2B21DFC2F00FD::-51:cul868

2022.08.27 16:02:37.739 4: CUL_Parse: cul868 A 0E D7 8202 1DFC2F B2B2B2 0101C6002127 -54.5
2022.08.27 16:02:37.741 5: cul868: dispatch A0ED782021DFC2FB2B2B20101C60021::-54.5:cul868

2022.08.27 16:02:37.774 4: CUL_Parse: cul868 A 0B D7 A258 B2B2B2 1DFC2F 00FD2E -51
2022.08.27 16:02:37.775 5: cul868: dispatch A0BD7A258B2B2B21DFC2F00FD::-51:cul868

##### direkt danach sieht senden über cul im log normal aus, aber die messages gehen nicht mehr on air
2022.08.27 16:02:37.856 5: cul868 sending As0A7480021ACE1F1C1BE300
2022.08.27 16:02:37.857 5: CUL 1C1BE3 dly:38ms
2022.08.27 16:02:37.897 5: DevIo_SimpleWrite cul868: As0A7480021ACE1F1C1BE300


##### manuelles reopen lieferte opened im cul state
2022.08.28 16:50:36.671 3: Setting cul868 serial parameters to 38400,8,N,1
2022.08.28 16:50:36.784 5: DevIo_SimpleWrite cul868: V
2022.08.28 16:50:39.790 5: DevIo_SimpleWrite cul868: V
2022.08.28 16:50:42.795 5: DevIo_SimpleWrite cul868: V
2022.08.28 16:50:45.800 1: Cannot init /dev/serial/by-id/usb-busware.de_CUL868-if00, ignoring it (cul868)

##### ebenfalls erfolgloser fhem restart liefert auch opened
2022.08.28 17:00:38.881 3: Opening cul868 device /dev/serial/by-id/usb-busware.de_CUL868-if00
2022.08.28 17:00:38.937 3: Setting cul868 serial parameters to 38400,8,N,1
2022.08.28 17:00:48.054 1: Cannot init /dev/serial/by-id/usb-busware.de_CUL868-if00, ignoring it (cul868)
2022.08.28 17:00:48.058 2: Switched cul868 rfmode to HomeMatic


wäre es möglich beim cul einen "alive-check" einzubauen?
schön wäre eine regelmässiger request an den cul, der ggf zu einem automatischen reopen führt.

wenn man zu solch einem "roundtrip" noch irgendwo die dauer des roundtrip sehen könnte, hätte man zusätzlich einen ungefähren anhaltspunkt über die "latenz" der verbindung.
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

mi.ke

Man könnte als interimslösung auch die CUL_TIME in den Internals in einem bestimmen Interval abfragen und bei einer größeren Abweichung eine Nachricht generieren oder eben ein reopen ausführen lassen.

cheers
mi.ke
FHEM 5.9 | RPi4 + 5 x RPi(Z) + FB7590 + FB 6890 LTE via LAN und WAN (VPN) verbunden.
2 x CUL868 + 3 x RFXTRX(e) + 6 x HMwLanGW + 4 x z2tGw + 5 x LGW + 2 x IRBlast + CO2 +++
FS20, FHT, FMS, Elro(mod), CM160, Revolt, LGTV, STV, AVR, withings, HM-sec-*, HM-CC-RT-DN, AMAD, PCA301, arlo, Aqara

yersinia

Ich überwache stündlich (über ein at) diverse Gerätetypen und bei den CULs versuche ich dann drei mal ein reopen (via ein paar perl zeilen in der myutils). Insbesondere dem alten bootloader hatte ich öfters Ausfälle aka Hängen des Arduinos, seitdem ich TSCUL und SIGNALduino nutze treten die Probleme nicht mehr auf. Schau doch mal, ob der CUL ein Reading oder Internal hat, was sich regelmässig ändert. Ansonsten kannst du zB auch version oder uptime abfragen, da fällt es auf, wenn es keine Antwort gibt.
viele Grüße, yersinia
----
FHEM 6.3 (SVN) on RPi 4B with RasPi OS Bullseye (perl 5.32.1) | FTUI
nanoCUL->2x868(1x ser2net)@tsculfw, 1x433@Sduino | MQTT2 | Tasmota | ESPEasy
VCCU->14xSEC-SCo, 7xCC-RT-DN, 5xLC-Bl1PBU-FM, 3xTC-IT-WM-W-EU, 1xPB-2-WM55, 1xLC-Sw1PBU-FM, 1xES-PMSw1-Pl

rudolfkoenig

Ich wuerde mit einem at die Zeit der letzten Kommunikation (gespeichert im Internal cul868_TIME) auswerten, evtl gekoppelt mit regelmaessiger Abfrage der Version.

Ein Nebeneffektfreies alive-check ist bei der aktuellen Architektur (CUL.pm und culfw) aufwendig, und ich bin noch nicht ueberzeugt, dass der Umbau sich lohnt.


frank

dieser spezielle fall:

- kein empfang
- kein senden
- kommunikation zwischen fhem und cul ohne probleme

war scheinbar ein sporadisches PLL_NO_LOCK problem, das seit culfw 1.59 gelöst ist.

seit update meiner culfw 1.58 auf 1.67 wurden 2 dieser ereignisse registriert und automatisch beseitigt.


dafür gibt es nun leider ein neues problem:
https://forum.fhem.de/index.php?topic=137450.0
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html