Disconnects von HMLAN01/02

Begonnen von KurtB, 27 Dezember 2018, 21:34:39

Vorheriges Thema - Nächstes Thema

KurtB

Hallo zusammen,
ich habe leider ein Problem, welchem ich nicht auf die Spur komme. Ich verwende FHEM seit vielen Jahren und hatte nur ein mal ein Problem mit der Stabilität, damals konnte das durch ein Firmwareupdate (auf 0.965) der HMLANs beheben.
Daraufhin gehörten Disconnects wieder der Vergangenheit an. Leider habe ich wieder das gleiche Problem - die HMLANs rebooten anscheinend immer wieder:
FHEM Uptime: 10 Tage
HMLAN1 uptime 001 46:21:08.825
HMLAN2 uptime 000 01:43:23.690


Meine Konfiguration:
- Ubuntu 18.04 VM auf einem XenServer 7.1 (seit Jahren bis auf das einspielen von Patches unverändert)
- Zwei HMLAN (01/02)
- vccu
- HMLAN1: msgKeepAlive dlyMax:3.008 bufferMin:1
- HMLAN2: msgKeepAlive dlyMax:0.936 bufferMin:4


Was habe ich bereits probiert:
- Upgrade des OS von Ubunt 16.04 auf 18.04 --> Keine Verbesserung
- Erstellen eines eignen VLAN für FHEM (nur die zwei HMLANS und die FHEM VM) --> keine Verbesserung
- testhalber löschen von fast jedem Code aus der fhem.cfg --> keine Verbesserung

Ich habe Logging mit verbos 5 aktiviert und hoffe, es kann mir jemand einen Tipp geben, wo ich suchen soll oder welche Informationen noch benötigt werden! Ich habe 300MB Logfile über die letzten 10 Tage gesammelt, hier aber nur einige Schnipsel angehängt. Ich kann gerne mehr zur Verfügung stellen.

Ich bin für jeden Tipp dankbar!!

frank

wieviel stunden/jahre haben die drauf?
vielleicht mal kondensatoren tauschen?
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

KurtB

Sind ca. 5 Jahre alt - Dauerbetrieb...

renardfm

Hi. Ich hatte vor kurzem extrem häufige Reboots. Am Ende lag es m.E daran dass ich den Raspi über Powerline angeschlossen hatte. Scheint ein Synchronisationsproblem damit zu geben. Seit der Raspi am Gigabitnetzwerk hängt, gehts wieder deutlich besser!

Nobby1805

Das kann ich bestätigen.
Ich habe einen HMLAN direkt am LAN und einen über Powerline gekoppelt. Jeweils der (auch nach tauschen der HMLAN) über Powerline zeigt zwischen keinem und ca. 10 Disconnects am Tag.
FHEM-Featurelevel: 6.2   (fhem.pl:28227/2023-11-29) auf Windows 10 Pro mit Strawberry Perl 5.32.1.1-32bit
TabletUI: 2.7.15
IO: 2xHMLAN(0.965)|HMUSB2(0.967)

Hollo

Laut dlyMax kommen die Keepalive ja rechtzeitig.
Außerdem scheint es ja wirklich reboots zu geben, nicht nur disconnects.

In dem Fall würde ich mal ein anderes Steckernetzteil probieren, oder halt auch die Elkos im HMLAN tauschen. Die waren scheinbar nicht soo toll.
FHEM 6.x auf RPi 3B Buster
Protokolle: Homematic, Z-Wave, MQTT, Modbus
Temp/Feuchte: JeeLink-Clone und LGW mit LaCrosse/IT
sonstiges: Linux-Server, Dreambox, "RSS-Tablet"

KurtB

#6
Eben, deshalb kann ich mir das ganze ja nicht erklären. Bei einem Netzwerk "Hicup" würde es zwar einen Disconnect, aber keinen Reboot geben und Laut dlyMax, apptime und Log kann zumindest ich keinen Fehler erkennen.

An einen HW Fehler hätte ich nicht gedacht, da es beide betrifft, aber vielleicht ist das ja wirklich der Grund!

Ich habe bereits nach Kondensatortasuch gesucht, aber leider nichts gefunden - hätte Ihr einen Link für mich?

Bevor ich jetzt den Lötkolben auspacke, kann sich noch jemand einen anderen Grund vorstellen?

LuckyDay

#7
ZitatIch habe bereits nach Kondensatortasuch gesucht, aber leider nichts gefunden - hätte Ihr einen Link für mich?

Im endefekt mußt du die dicken Kondensatoren austauschen

ein apptime fehlt trotzdem

und hast du IP tv inzwischen? scheint auch ein Problem gewesen zu sein

PS meine HMlans sind auch schon 8 Jahre alt und zeigen noch kein Problem.


KurtB

Oups, du hast natürlich recht, apptime hab ich nicht angehängt - sorry. War gerade nicht aktiv, lasse apptime ein paar tage laufen und stelle es rein, wenn es einige Disconnects gegeben hat.

Was meinst Du mit IP TV? Ich verwende seit Ewigkeiten TVHeadend (Streamingserver mit einer Satkarte in einer VM am gleichen XenServer) und mehrere XBMC/Kodi Mediacenter, das gibts aber alles schon länger als meine FHEM, Homematic installation...




KurtB

Nun noch das fehlende apptime. Log ist wieder auf verbose 1 zurückgestellt.

Disconnects aus dem Logfile:

2018.12.30 01:22:03 1: HMLAN_Parse: HMLAN2 new condition disconnected
2018.12.30 01:22:03 1: 192.168.101.32:1000 disconnected, waiting to reappear (HMLAN2)
2018.12.30 01:22:03 1: HMLAN_Parse: HMLAN2 new condition disconnected
2018.12.30 01:23:08 1: HMLAN_Parse: HMLAN2 new condition init
2018.12.30 01:23:08 1: 192.168.101.32:1000 reappeared (HMLAN2)
2018.12.30 01:23:08 1: HMLAN_Parse: HMLAN2 new condition ok
2018.12.30 05:54:47 1: HMLAN_Parse: HMLAN2 new condition disconnected
2018.12.30 05:54:47 1: 192.168.101.32:1000 disconnected, waiting to reappear (HMLAN2)
2018.12.30 05:54:47 1: HMLAN_Parse: HMLAN2 new condition disconnected
2018.12.30 05:55:52 1: HMLAN_Parse: HMLAN2 new condition init
2018.12.30 05:55:52 1: 192.168.101.32:1000 reappeared (HMLAN2)
2018.12.30 05:55:53 1: HMLAN_Parse: HMLAN2 new condition ok
2018.12.30 09:07:47 1: HMLAN_Parse: HMLAN2 new condition disconnected
2018.12.30 09:07:47 1: 192.168.101.32:1000 disconnected, waiting to reappear (HMLAN2)
2018.12.30 09:07:47 1: HMLAN_Parse: HMLAN2 new condition disconnected
2018.12.30 09:08:51 1: HMLAN_Parse: HMLAN2 new condition init
2018.12.30 09:08:51 1: 192.168.101.32:1000 reappeared (HMLAN2)
2018.12.30 09:08:52 1: HMLAN_Parse: HMLAN2 new condition ok
2018.12.30 11:51:22 1: HMLAN_Parse: HMLAN1 new condition disconnected
2018.12.30 11:51:22 1: 192.168.101.31:1000 disconnected, waiting to reappear (HMLAN1)
2018.12.30 11:51:22 1: HMLAN_Parse: HMLAN1 new condition disconnected
2018.12.30 11:52:28 1: HMLAN_Parse: HMLAN1 new condition init
2018.12.30 11:52:28 1: 192.168.101.31:1000 reappeared (HMLAN1)
2018.12.30 11:52:28 1: HMLAN_Parse: HMLAN1 new condition ok


apptime seit Gestern:

active-timers: 26; max-active timers: 50; max-timer-load: 6  min-tmrHandlingTm: 0.0ms; max-tmrHandlingTm: 73.7ms; totAvgDly: 3.4ms

name                                     function                               max    count      total  average   maxDly   avgDly TS Max call     param Max call
HMLAN2                                   HMLAN_Ready                           3029      108    9066.16    83.95     0.00     0.00 30.12. 05:54:52 HASH(HMLAN2)
HMLAN1                                   HMLAN_Ready                           3003       52    3015.07    57.98     0.00     0.00 30.12. 11:51:26 HASH(HMLAN1)
HMLAN2                                   HMLAN_Read                             115    12672   22477.90     1.77     0.00     0.00 29.12. 21:02:03 HASH(HMLAN2)
HMLAN1                                   HMLAN_Read                             101    12593   25097.33     1.99     0.00     0.00 29.12. 21:01:55 HASH(HMLAN1)
tmr-CUL_HM_motionCheck                   OG_Klo_Taster_Btn_01                    73        1      73.65    73.65     0.35     0.35 29.12. 21:01:37 OG_Klo_Taster_Btn_01:motionCheck
ntfy.set.OG_Klo_Taster_Btn_01.Nacht.on   notify_Exec                             72        2      76.35    38.18     0.00     0.00 29.12. 21:01:37 HASH(ntfy.set.OG_Klo_Taster_Btn_01.Nacht.on); HASH(OG_Klo_Taster_Btn_01)
OG_Klo_Licht_Decke                       CUL_HM_Set                              68       73     210.98     2.89     0.00     0.00 29.12. 21:01:37 HASH(OG_Klo_Licht_Decke); OG_Klo_Licht_Decke; 20; 120; 0.5
tmr-HMinfo_autoUpdate                    sUpdt                                   53      188    3811.71    20.28     6.78     1.41 29.12. 22:36:03 sUpdt:hm
Alle_Lichter                             structure_Set                           36       12      36.65     3.05     0.00     0.00 29.12. 21:07:44 HASH(Alle_Lichter); Alle_Lichter; ?
ntfy.cnt.Bewegung.AA_Bewegung            notify_Exec                             29    19980   12038.98     0.60     0.00     0.00 30.12. 00:10:01 HASH(ntfy.cnt.Bewegung.AA_Bewegung); HASH(OG_Gang_Bewegung_01)
tmr-CUL_HM_motionCheck                   UG_Stiege_Bewegung_01                   27        8      81.54    10.19     3.08     1.22 29.12. 21:19:32 UG_Stiege_Bewegung_01:motionCheck
ntfy.cnt.Tueren.AA_Offene_Tueren         notify_Exec                             25    19980    1478.06     0.07     0.00     0.00 29.12. 23:55:39 HASH(ntfy.cnt.Tueren.AA_Offene_Tueren); HASH(OG_Klo_Tuer_01)
OG_Lichter                               structure_Set                           22       12      23.00     1.92     0.00     0.00 29.12. 21:07:44 HASH(OG_Lichter); OG_Lichter; ?
OG_WoZi_Licht_Esstisch_Sw                CUL_HM_Set                              21       14      66.71     4.77     0.00     0.00 29.12. 21:07:47 HASH(OG_WoZi_Licht_Esstisch_Sw); OG_WoZi_Licht_Esstisch_Sw; off
tmr-CUL_HM_motionCheck                   EG_Gang_Bewegung_01                     20       26     223.82     8.61     9.15     2.40 29.12. 21:59:51 EG_Gang_Bewegung_01:motionCheck
tmr-CUL_HM_respPendTout                  respPend                                19      135     230.28     1.71    82.96     2.46 29.12. 23:52:46 respPend:4C2D88
tmr-watchdog_Trigger                     HASH(0x55cfe3b396f0)                    15        7      71.73    10.25     8.24     3.87 29.12. 22:06:54 HASH(watchdog_OG_Kueche_Taster_01_Motion)
OG_Kueche_Licht_Decke_Sw                 CUL_HM_Set                              15       15     119.32     7.95     0.00     0.00 29.12. 22:06:54 HASH(OG_Kueche_Licht_Decke_Sw); OG_Kueche_Licht_Decke_Sw; 0; 0; 10
tmr-CUL_HM_motionCheck                   OG_Stiege_Bewegung_01                   15        5      42.12     8.42     5.13     1.84 29.12. 21:34:12 OG_Stiege_Bewegung_01:motionCheck
tmr-CUL_HM_motionCheck                   OG_Gang_Bewegung_01                     14       31     240.35     7.75     8.54     3.09 30.12. 12:13:45 OG_Gang_Bewegung_01:motionCheck
ntfy.cnt.Kellerfenster.AA_Offene_Fenster_UG notify_Exec                             14    19980    1574.14     0.08     0.00     0.00 30.12. 00:46:55 HASH(ntfy.cnt.Kellerfenster.AA_Offene_Fenster_UG); HASH(UG_Heizraum_Fenster_02)
AA_Bewegung                              dummy_Set                               12     4551    3250.67     0.71     0.00     0.00 29.12. 21:19:32 HASH(AA_Bewegung); AA_Bewegung; 2
tmr-CUL_HM_motionCheck                   UG_Trockenraum_Bewegung_01              11        4      39.65     9.91     2.70     1.44 30.12. 11:51:43 UG_Trockenraum_Bewegung_01:motionCheck
ntfy.cnt.Fenster.AA_Offene_Fenster       notify_Exec                             10    19980    1894.77     0.09     0.00     0.00 30.12. 10:09:56 HASH(ntfy.cnt.Fenster.AA_Offene_Fenster); HASH(EG_Gang_Fenster_01)
tmr-CUL_HM_qStateUpdatIfEnab             sUpdt                                   10       51     182.53     3.58    16.04     2.94 29.12. 21:45:09 sUpdt:OG_Kueche_Licht_Decke_Sw
tmr-CUL_HM_motionCheck                   UG_Werksatt_Bewegung_01                  9        1       9.83     9.83     0.37     0.37 29.12. 21:01:37 UG_Werksatt_Bewegung_01:motionCheck
tmr-CUL_HM_motionCheck                   GT_Hinten_Bewegung_01                    9        4      29.76     7.44     9.58     3.06 29.12. 21:01:36 GT_Hinten_Bewegung_01:motionCheck
AA_Offene_Tueren                         dummy_Set                                8      370     260.16     0.70     0.00     0.00 29.12. 23:55:39 HASH(AA_Offene_Tueren); AA_Offene_Tueren; 1
tmr-CUL_HM_motionCheck                   GT_Eingang_Bewegung_02                   8        2      15.99     7.99     0.74     0.56 30.12. 09:09:18 GT_Eingang_Bewegung_02:motionCheck
tmr-CUL_HM_motionCheck                   GT_Eingang_Bewegung_01                   7        6      38.41     6.40    12.00     3.46 29.12. 21:01:36 GT_Eingang_Bewegung_01:motionCheck
tmr-watchdog_Trigger                     HASH(0x55cfe3b3f3d0)                     7       12      55.78     4.65     5.79     2.30 30.12. 00:15:01 HASH(watchdog_OG_Gang_Bewegung_01)
tmr-CUL_HM_motionCheck                   EG_VoZi_Bewegung_01                      7       13      91.52     7.04  1462.72   113.74 30.12. 11:43:58 EG_VoZi_Bewegung_01:motionCheck
OG_Gang_Licht_Decke                      CUL_HM_Set                               7       12      52.44     4.37     0.00     0.00 30.12. 00:15:01 HASH(OG_Gang_Licht_Decke); OG_Gang_Licht_Decke; 0; 0; 10
OG_WoZi_Licht_Indirekt                   CUL_HM_Set                               7       17      65.36     3.84     0.00     0.00 30.12. 00:01:33 HASH(OG_WoZi_Licht_Indirekt); OG_WoZi_Licht_Indirekt; off
AA_Offene_Fenster_UG                     dummy_Set                                7      230     635.68     2.76     0.00     0.00 29.12. 21:57:22 HASH(AA_Offene_Fenster_UG); AA_Offene_Fenster_UG; 0
ntfy.set.OG_Klo_Tuer_01.OG_Klo_Licht_Decke.on notify_Exec                              7      122      39.75     0.33     0.00     0.00 30.12. 00:01:59 HASH(ntfy.set.OG_Klo_Tuer_01.OG_Klo_Licht_Decke.on); HASH(OG_Klo_Tuer_01)
ntfy.set.OG_Klo_Taster_Motion.OG_Klo_Licht_Decke.on notify_Exec                              7       38      69.15     1.82     0.00     0.00 30.12. 00:02:00 HASH(ntfy.set.OG_Klo_Taster_Motion.OG_Klo_Licht_Decke.on); HASH(OG_Klo_Taster_Motion)
tmr-at_Exec                              HASH(0x55cfe3dd5330)                     6      942    1016.32     1.08  3004.24     7.71 30.12. 06:25:03 HASH(at.upd.HMLAN2_Funklast)
GT_Lichter                               structure_Set                            6        3       6.75     2.25     0.00     0.00 29.12. 21:07:44 HASH(GT_Lichter); GT_Lichter; ?
ntfy.set.OG_Klo_Taster_Btn_02.Nacht.off  notify_Exec                              6        2       9.76     4.88     0.00     0.00 30.12. 11:37:52 HASH(ntfy.set.OG_Klo_Taster_Btn_02.Nacht.off); HASH(OG_Klo_Taster_Btn_02)
tmr-HMLAN_KeepAliveCheck                 keepAliveCk                              6     4608     112.42     0.02  2032.51     1.51 30.12. 05:54:47 keepAliveCk:HMLAN2


Irgendwelche Ideen?

Auf jeden Fall auch ein Herzliches Danke für Eure bisherige Unterstützung! :-)
LG,
Kurt

Hollo

Mir fällt da nur Dein "Bewegungsmelder" auf, aber ich kann das nicht wirklich deuten.
Kannst Du den vielleicht mal "auskommentieren" zum Testen, oder hat der vielleicht irgendwelche Probleme?
FHEM 6.x auf RPi 3B Buster
Protokolle: Homematic, Z-Wave, MQTT, Modbus
Temp/Feuchte: JeeLink-Clone und LGW mit LaCrosse/IT
sonstiges: Linux-Server, Dreambox, "RSS-Tablet"

Deudi

Zu dem Thema gibt es ja noch diesen Thread: https://forum.fhem.de/index.php/topic,20776.0.html

Ich habe vier HMLAN seit einigen Jahren mit neuster Firmware. Mittlerweile sind diese in einem eigenen VLAN für FHEM und zusätzlich ist seit kurzem noch eine Port-Isolation am Switch für den exklusiven Zugriff durch den FHEM Servers eingerichtet. Trotzdem häufen sich wieder die Disconnects (mit Reboot). Entweder sind das die HM-IP Geräte des Nachbarn oder die Elkos sind langsam hin. Nach all den schon vorgenommenen Maßnahmen tippe ich mittlerweile auf die Elkos und werde diese zeitnah tauschen.
Gigabyte Brix, Ubuntu 16.04.3 LTS, Homematic, Z-Wave, EnOcean, Shelly@MQTT, SIGNALduino, JeeLink DAVIS-Sketch

Gisbert

#12
Zitat von: Deudi am 04 Januar 2019, 14:43:09
Zu dem Thema gibt es ja noch diesen Thread: https://forum.fhem.de/index.php/topic,20776.0.html

Ich habe vier HMLAN seit einigen Jahren mit neuster Firmware. Mittlerweile sind diese in einem eigenen VLAN für FHEM und zusätzlich ist seit kurzem noch eine Port-Isolation am Switch für den exklusiven Zugriff durch den FHEM Servers eingerichtet. Trotzdem häufen sich wieder die Disconnects (mit Reboot). Entweder sind das die HM-IP Geräte des Nachbarn oder die Elkos sind langsam hin. Nach all den schon vorgenommenen Maßnahmen tippe ich mittlerweile auf die Elkos und werde diese zeitnah tauschen.

Hallo Deudi,
wie ist der Stand bei deinen HMLANs? Hat der Austausch der Elkos was gebracht?
Bei mir erscheint häufig beim Freezmon als Ursache:
HMLAN_KeepAliveCheck

Viele​ Grüße​ Gisbert​
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | tuya local | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY | DEYE | JK-BMS | ESPHome

Hollo

Disconnects wegen "keppAlive" haben m.E. nichts mit den Elkos zu tun.

Abstürze/Reboot wegen Spannungseinbruch = Elkos trocken = Kapazitätsverlust = tauschen
Disconnetcs wegen keepAlive = Störungen/Verzögerungen im Netzwerk = analysieren/testen/verbessern

Anmerkung:
Ich habe 2 HMLAN (mit getauschten Elkos und externer Antenne) im gemeinsamen LAN und in den letzten Monaten/Jahren? keine erkennbaren Probleme (LOG jetzt nicht kontrolliert).

P.S.:
Ich habe die zugehörigen LAN-Ports mal irgendwann auf die zugehörige Einstellung "festgenagelt", damit die Auto-Erkennung und Green-Funktionen usw. da nicht reinfunkt.
FHEM 6.x auf RPi 3B Buster
Protokolle: Homematic, Z-Wave, MQTT, Modbus
Temp/Feuchte: JeeLink-Clone und LGW mit LaCrosse/IT
sonstiges: Linux-Server, Dreambox, "RSS-Tablet"

Gisbert

Hallo Hollo,

ZitatDisconnetcs wegen keepAlive = Störungen/Verzögerungen im Netzwerk = analysieren/testen/verbessern
Danke für den Hinweis, aber wie analysiert, testet und vebessert man denn?

Ich hab den HMLAN jetzt in etwa an die Stelle verpflanzt, an der er 3,5 Jahre stand, vor ca. einem halben Jahr habe ich ihn umgesetzt.
Vorher war er näher am Router dran, jetzt ist er das wieder.

Erwähnen sollte ich vielleicht noch, dass ich vor ca. einem Jahr (Februar/März 2018) die Stummelantenne gegen eine Groundplane-Antenne geatauscht habe.
Damit haben sich Empfangsleistungen signifikant verbessert, ca. 5-10 dB.
Ich führe die Probleme nicht auf die Groundplane-Antenne zurück, da die Probleme deutlich später auftauchten.

Den Austausch der beiden großen Elkos hat das Teil zumindest überlebt; da ich nicht genau die gleichen hatte, habe ich 25V/470µF statt der 25V/100µF mit der gleichen Baugröße reingelötet.
Ich werde mal beobachten, wie es jetzt aussieht.
Der HMLAN hat eine feste IP-Adresse, daran kann es also nicht liegen.

Viele Grüße Gisbert
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | tuya local | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY | DEYE | JK-BMS | ESPHome