[gelöst] HMLAN defekt, Hilfe bei der Interpretation von CUL_HM_procQs

Begonnen von ChrisK, 09 Februar 2020, 14:10:02

Vorheriges Thema - Nächstes Thema

ChrisK

Hallo zusammen,

mein HM-CFG-LAN scheint vor einer Woche kaputt gegangen zu sein.
Sobald er angeschlossen ist habe ich im Log alle paar Minuten folgende Einträge:
2020.02.07 00:10:52 1: HMLAN_Parse: HMLAN1 new condition ok
2020.02.07 00:12:38 1: 192.168.2.3:1000 disconnected, waiting to reappear (HMLAN1)
2020.02.07 00:12:38 1: HMLAN_Parse: HMLAN1 new condition disconnected
2020.02.07 00:12:38 1: HMLAN_Parse: HMLAN1 new condition init
2020.02.07 00:12:38 1: 192.168.2.3:1000 reappeared (HMLAN1)


Ich habe hierzu mal ein bisschen im Forum recherchiert und auch schon die Elkos ausgetauscht, das hat leider nicht geholfen.
Netzwerktechnisch hat sich nichts geändert hier, wo der HMLAN seit knapp 5 Jahren brav seine Dienste tut.
Seine IP habe ich auch schon geändert, was auch nichts gebracht hat. Im HomeMatic Lan-Interface Configurator wird er alle paar Minuten als online mit IP, online ohne IP und offline angezeigt.
Ich gehe jetzt erstmal davon aus, dass er defekt ist und werde ihn durch eine CCU3 ersetzen.

Um sicher zu gehen, dass er auch das Problem ist (das UI ist extrem langsam, ein Seitenaufbau dauert immer mindestens eine Minute, bricht auch häufig komplett ab) wollte ich fhem mal ohne die Definition vom HMLAN starten. Das geht grundsätzlich, allerdings ist das UI weiterhin sehr langsam. Ich habe mal apptime gestartet und nach maxDly sortiert und jetzt kommt meine Frage:
Ganz oben erscheint CUL_HM_procQs als am längsten wartender Prozess:

name                                     function                               max    count      total  average   maxDly   avgDly TS Max call     param Max call
tmr-CUL_HM_procQs                        CUL_HM_procQs                            0        9       1.15     0.13 55217.02 51889.92 09.02. 13:23:04 CUL_HM_procQs
tmr-HttpUtils_Err                        HASH_unnamed                             0        3       0.83     0.28 53217.52 51200.32 09.02. 13:21:17 HASH(0x56444df24018)
tmr-BlockingKill                         HASH_unnamed                             3       12      12.68     1.06 51495.00 48090.63 09.02. 13:26:37 HASH(0x56444d035408)
tmr-XBMC_Check                           HASH(0x564446ad6488)                    19        4      44.90    11.22 47250.87 46971.28 09.02. 13:26:37 HASH(wz_KODI)
tmr-FW_closeInactiveClients              0                                        3        4      11.55     2.89 47247.51 46968.30 09.02. 13:23:04 0
tmr-SYSMON_Update                        HASH(0x56444946cdc8)                     7        4      25.81     6.45 46525.25 46444.01 09.02. 13:24:50 HASH(sysmon)
tmr-Weather_GetUpdate                    HASH(0x56444a1fa270)                    37        4     106.30    26.57 46498.07 46418.23 09.02. 13:23:04 HASH(wetterkanal)
tmr-at_Exec                              HASH(0x564448e04f10)                    32        2      58.17    29.09 40450.57 22026.55 09.02. 13:21:17 HASH(heizung_einschalten_timer)
tmr-at_Exec                              HASH(0x564448bcd938)                    38        2      64.92    32.46 40424.80 21994.36 09.02. 13:25:41 HASH(heizung_ausschalten_timer)
tmr-HTTPMOD_GetUpdate                    update                                  13        3      15.54     5.18 38650.97 38650.61 09.02. 13:26:37 update:Aral_Bonnstr
tmr-CUL_HM_ActCheck                      ActionDetector                           0        1       0.93     0.93 38649.06 38649.06 09.02. 13:26:37 ActionDetector
tmr-PRESENCE_StartLocalScan              HASH(0x564449637e98)                     8        4      28.29     7.07 26212.53 26187.63 09.02. 13:24:50 HASH(hm_cfg_lan)
tmr-PRESENCE_StartLocalScan              HASH(0x564449639108)                    12        4      40.10    10.03 26146.97 21633.56 09.02. 13:24:50 HASH(speicher)
tmr-PRESENCE_StartLocalScan              HASH(0x5644494fd5e8)                    12        4      36.08     9.02 20189.38 20135.79 09.02. 13:23:54 HASH(Handy)
tmr-PRESENCE_StartLocalScan              HASH(0x564449879380)                    11        4      32.46     8.11 20130.17 20111.18 09.02. 13:22:08 HASH(samsung_tv)


Ich würde gerne sicherstellen, dass fhem normal läuft wenn hmlan nicht eingebunden ist.
Wie kriege ich raus, wofür CUL_HM_procQs steht?

Vielen Dank im voraus!
Chris

frank

FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

ChrisK

Zitat von: frank am 09 Februar 2020, 14:23:35
zeig mal ein list vom hmlan und deiner vccu.
vccu hab ich (leider bisher) nicht.

Hier das list vom hmlan:
Internals:
   CFGFN      ./cfgfiles/homematic.cfg
   DEF        192.168.2.33:1000
   DeviceName 192.168.2.33:1000
   FD         73
   HMLAN1_MSGCNT 216
   HMLAN1_TIME 2020-02-09 14:56:39
   IFmodel    LAN
   NAME       HMLAN1
   NR         45
   NTFY_ORDER 50-HMLAN1
   PARTIAL   
   RAWMSG     E367193,0000,005E3E58,FF,FFB0,8F847036719300000000DE2A
   RSSI       -80
   STATE      opened
   TYPE       HMLAN
   XmitOpen   1
   assignedIDsCnt 39
   msgKeepAlive dlyMax:36.807 bufferMin:-31
   msgLoadCurrent 6
   msgLoadHistoryAbs 5min steps: 6/6/6/5/0/0/0/0/0/0/0/0
   owner      286507
   uptime     000 01:42:56.344
   Helper:
     DBLOG:
       D-HMIdAssigned:
         myDbLog:
           TIME       1581255403.46434
           VALUE      286507
       D-HMIdOriginal:
         myDbLog:
           TIME       1581255403.46434
           VALUE      286507
       D-firmware:
         myDbLog:
           TIME       1581255403.46434
           VALUE      0.964
       D-serialNr:
         myDbLog:
           TIME       1581255403.46434
           VALUE      LEQ0404057
       Xmit-Events:
         myDbLog:
           TIME       1581256598.98644
           VALUE      disconnected:6 init:6 ok:6
       cond:
         myDbLog:
           TIME       1581256598.98644
           VALUE      ok
       loadLvl:
         myDbLog:
           TIME       1581256598.97042
           VALUE      low
       prot_disconnected:
         myDbLog:
           TIME       1581256548.54573
           VALUE      last
       prot_init:
         myDbLog:
           TIME       1581256598.68923
           VALUE      last
       prot_ok:
         myDbLog:
           TIME       1581256598.98644
           VALUE      last
       state:
         myDbLog:
           TIME       1581256598.70597
           VALUE      CONNECTED
   READINGS:
     2020-02-09 14:36:43   D-HMIdAssigned  286507
     2020-02-09 14:36:43   D-HMIdOriginal  286507
     2020-02-09 14:36:43   D-firmware      0.964
     2020-02-09 14:36:43   D-serialNr      LEQ0404057
     2020-02-09 14:56:38   Xmit-Events     disconnected:6 init:6 ok:6
     2020-02-09 14:56:38   cond            ok
     2020-02-09 14:56:38   loadLvl         low
     2020-02-09 14:55:48   prot_disconnected last
     2020-02-09 14:56:38   prot_init       last
     2020-02-09 14:56:38   prot_ok         last
     2020-02-09 14:56:38   state           opened
   helper:
     assIdCnt   39
     assIdRep   39
     info       03C4,LEQ0404057,286507,286507
     setTime    48256
     cnd:
       0          6
       253        6
       255        6
     ids:
       261F3F:
         cfg        +261F3F,00,00,00
         name       fb_mini
       2D01C7:
         cfg        +2D01C7,00,00,00
         chn        02
         flg        0
         msg       
         name       hz_verteiler1
         to         1581255697.18628
       2E2948:
         cfg        +2E2948,00,00,00
         name       az_rollo
       2F2921:
         cfg        +2F2921,00,00,00
         name       ba_thermometer
       2FDEB8:
         cfg        +2FDEB8,00,00,00
         chn        02
         flg        0
         msg       
         name       wz_rollo2
         to         1581255416.20392
       2FDFD8:
         cfg        +2FDFD8,00,00,00
         name       ho_rollo2
       2FE00C:
         cfg        +2FE00C,00,00,00
         name       sz_rollo
       2FE042:
         cfg        +2FE042,00,00,00
         chn        02
         flg        0
         msg       
         name       wz_rollo3
         to         1581255417.17377
       2FF0E2:
         cfg        +2FF0E2,00,00,00
         name       ho_rollo1
       2FF120:
         cfg        +2FF120,00,00,00
         chn        02
         flg        0
         msg       
         name       ba_rollo2
         to         1581255413.29038
       2FF2F2:
         cfg        +2FF2F2,00,00,00
         name       zz_wz_rollo1
       302FC9:
         cfg        +302FC9,00,00,00
         name       wz_schalter
       3030BC:
         cfg        +3030BC,00,00,00
         name       sz_schalter
       3030EE:
         cfg        +3030EE,00,00,00
         name       flur_schalter
       324BFF:
         cfg        +324BFF,00,00,00
         name       hz_verteiler2
       336AE6:
         cfg        +336AE6,00,00,00
         chn        02
         flg        0
         msg       
         name       ba_rollo1
         to         1581255412.72317
       33E795:
         cfg        +33E795,00,00,00
         name       ku_licht
       34B054:
         cfg        +34B054,00,00,00
         name       bad_klein_thermostat
       35AD41:
         cfg        +35AD41,00,00,00
         name       fensterkontakt1
       367193:
         cfg        +367193,00,00,00
         name       az_thermostat
       367804:
         cfg        +367804,00,00,00
         name       bad_thermostat
       367813:
         cfg        +367813,00,00,00
         name       sz_thermostat
       367818:
         cfg        +367818,00,00,00
         name       hwr_thermostat
       369CB0:
         cfg        +369CB0,00,00,00
         chn        02
         flg        0
         msg       
         name       wz_licht_klein
         to         1581255414.27146
       36A024:
         cfg        +36A024,00,00,00
         name       flur_licht
       36FAD4:
         cfg        +36FAD4,00,00,00
         name       flur_thermostat
       36FADC:
         cfg        +36FADC,00,00,00
         name       wz_thermostat
       36FAE2:
         cfg        +36FAE2,00,00,00
         chn        02
         flg        0
         msg       
         name       ho_thermostat
         to         1581255407.65691
       376DFA:
         cfg        +376DFA,00,00,00
         name       az_licht
       377751:
         cfg        +377751,00,00,00
         name       ez_licht
       37FCFD:
         cfg        +37FCFD,00,00,00
         name       tuer_klingel
       3B7C3E:
         cfg        +3B7C3E,00,00,00
         chn        03
         flg        0
         msg       
         name       wz_licht_dimmer
         to         1581255426.3138
       3B8E87:
         cfg        +3B8E87,00,00,00
         chn        00
         flg        0
         msg       
         name       az_licht_dimmer
         to         1581255910.69185
       3B8E98:
         cfg        +3B8E98,00,00,00
         chn        03
         flg        0
         msg       
         name       sz_licht_dimmer
         to         1581255423.2541
       3D376C:
         cfg        +3D376C,00,00,00
         name       az_schalter
       447FEB:
         cfg        +447FEB,00,00,00
         chn        00
         flg        0
         msg       
         name       HM_447FEB
         to         1581255640.82199
       58EAEA:
         cfg        +58EAEA,00,00,00
         chn        03
         flg        0
         msg       
         name       ez_licht_dimmer
         to         1581255421.66132
       5D7E91:
         cfg        +5D7E91,00,00,00
         chn        02
         flg        0
         msg       
         name       wz_rollo1
         to         1581255415.63505
       616DFD:
         cfg        +616DFD,00,00,00
         chn        03
         flg        0
         msg       
         name       ki_licht_dimmer
         to         1581255419.64928
     k:
       BufMin     -31
       DlyMax     36.807
       Next       1581256623.70499
       Start      1581256598.70499
     loadLvl:
       bl         40
       a:
         99
         90
         40
         0
       h:
         0          low
         40         batchLevel
         90         high
         99         suspended
     log:
       all        0
       sys        0
       ids:
         ARRAY(0x55dc83e9f628)
     q:
       HMcndN     0
       answerPend 0
       hmLanQlen  1
       keepAliveRec 1
       keepAliveRpt 0
       loadLastMax 6
       loadNo     11
       scnt       0
       ald:
         6
         6
         6
         5
         0
         0
         0
         0
         0
         0
         0
         0
       apIDs:
     ref:
       hmtL       6176266
       kTs        0
Attributes:
   hmId       286507
   hmLanQlen  1_min
   loadLevel  0:low,40:batchLevel,90:high,99:suspended
   room       zSystem


frank

defekt würde ich zunächst ausschliessen.
eventuell gibt es probleme durch hmip (zb nachbarn) oder die altbekannten netzwerkprobleme, siehe unzählige threads.

1. unbedingt fw 0.965 flashen.
eventuell im "keller", falls hmip zu sehr stört.
2. vccu definieren.
dann bekommst du zb ein überblick über nachbars homematic-zoo. ausserdem ist sie grundsätzlich zu empfehlen und erleichtert den "anstehenden" io-wechsel.
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

LuckyDay

maxDly  / avgDly--> bedeutet, dass z.B der timer 51889.92 also 51 sekunden warten musste bis er endlich durfte.

an deiner Stelle würde ich nach apptime max sortieren
und freezemon benützen

du hast irgendwo einen Mega Bremser in deiner Konfig.

das andere von Frank gilt sowieso

Gisbert

Hallo Chris,

was im Forum u.a. diskutiert wird, sind defekte Kondensatoren.
Diesen Weg bin ich auch gegangen, allerdings war in meinem Fall keine Verbesserung der extrem häufigen disconnects/reconnects sichtbar.

Ich bin dann im Homematic-Forum auf einen Beitrag gestoßen, der beschreibt, dass der HMLAN nicht gut mit einem 1000 MB-Port zurechtkommt.
Da in meinem Aufbau der HMLAN an einem Netgear-Switch hängt, bei dem ich die Leistung auf 10M full (ist das, was man dort neben 100M full, 100M half sowie auto auswählen kann) eingestellt habe. Seitdem gibt es vielleicht maximal einmal pro Tag ein disconnect. Ich hab mich sehr darüber gefreut, dass ich damit das Teil retten konnte.

Viele Grüße Gisbert
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY

ChrisK

Vielen Dank Euch allen schon mal!

Zitat von: frank am 09 Februar 2020, 15:39:54
defekt würde ich zunächst ausschliessen.
eventuell gibt es probleme durch hmip (zb nachbarn) oder die altbekannten netzwerkprobleme, siehe unzählige threads.

1. unbedingt fw 0.965 flashen.
eventuell im "keller", falls hmip zu sehr stört.
Das hatte ich vorher gesehen, dass die 0.965 überall empfohlen/gefordert wird, aber da ich von einem Defekt ausgegangen bin, habe ich das nicht weiter verfolgt. Das Problem war nämlich, dass ich immer die Meldung "Firmware update failed" kriege. Vermutlich, weil die Verbindung unterbrochen wird. Keller wird nicht klappen, da ich dort kein Internet habe. Da muss ich mir wohl was einfallen lassen.
Das Firmware Update geht doch nur über die Homematic Software, oder?

Würde denn das Firmware-Update helfen, wenn es wirklich ein Funk-Problem mit dem Nachbarn ist?
Zitat von: frank am 09 Februar 2020, 15:39:542. vccu definieren.
dann bekommst du zb ein überblick über nachbars homematic-zoo. ausserdem ist sie grundsätzlich zu empfehlen und erleichtert den "anstehenden" io-wechsel.
Das gehe ich auf jeden Fall an, sobald alles wieder geht.

Zitat von: fhem-hm-knecht am 09 Februar 2020, 15:53:54
maxDly  / avgDly--> bedeutet, dass z.B der timer 51889.92 also 51 sekunden warten musste bis er endlich durfte.

an deiner Stelle würde ich nach apptime max sortieren
und freezemon benützen

du hast irgendwo einen Mega Bremser in deiner Konfig.

das andere von Frank gilt sowieso
Ich denke, der Bremser ist der Versuch den HMLAN zu erreichen, der ja alle paar Minuten offline ist. Macht das Sinn oder wird der Bremser was ganz anderes sein?
Zitat von: Gisbert am 09 Februar 2020, 16:39:32
Ich bin dann im Homematic-Forum auf einen Beitrag gestoßen, der beschreibt, dass der HMLAN nicht gut mit einem 1000 MB-Port zurechtkommt.
Da in meinem Aufbau der HMLAN an einem Netgear-Switch hängt, bei dem ich die Leistung auf 10M full (ist das, was man dort neben 100M full, 100M half sowie auto auswählen kann) eingestellt habe. Seitdem gibt es vielleicht maximal einmal pro Tag ein disconnect. Ich hab mich sehr darüber gefreut, dass ich damit das Teil retten konnte.
Interessant, das muss ich auch mal probieren. Die Verbindung hat sich aber nicht geändert, der hängt am Switch, wo er seit knapp 5 Jahren hängt.

frank

FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

ChrisK

Zitat von: frank am 09 Februar 2020, 17:59:16
wieso "internet" für das update?
Braucht es keins? Umso besser.
Die Software, die ich von homematic auf dem Rechner drauf hab ist von damals, als ich das Ding gekauft habe. Danach habe ich alles nur über fhem gemacht. Hätte nicht gedacht, dass da das Firmware Update lokal vorliegt. Dann sollte das ja mit dem Keller gehen. Einen switch werde ich wohl brauchen, oder stecke ich den hmlan direkt an den Laptop? Ich probiere es einfach aus.

Gisbert

Zitat von: ChrisK am 09 Februar 2020, 17:24:21
... Die Verbindung hat sich aber nicht geändert, der hängt am Switch, wo er seit knapp 5 Jahren hängt.

Das war bei mir genauso, es lief jahrelang, ohne dass mir irgendetwas an besonderen Störungen aufgefallen ist. Dann ist es mir aufgefallen, und ich habe mich nur noch gewundert.
Es könnte eine zeitliche Übereinstimmung mit dem Auftauchen vieler Homematic-Geräte in der Nachbarschaft (mittlerweile >> 50 Stück) zusammenhängen, aber das kriege ich nicht mehr sauber rekonstruiert.
Wie dem auch sei, ich habe für mich eine sehr gute Lösung gefunden.
Es kann ja bei dir auch klappen, falls kein Hardwarefehler oder Sonstiges (ungünstige Firmware) vorliegt.

Viele Grüße Gisbert
Aktuelles FHEM | PROXMOX | Fujitsu Futro S740 | Debian 12 | UniFi | Homematic, VCCU, HMUART | ESP8266 | ATtiny85 | Wasser-, Stromzähler | Wlan-Kamera | SIGNALduino, Flamingo Rauchmelder FA21/22RF | RHASSPY

ChrisK

Danke nochmal Gisbert.

Das Anschließen des HMLAN an einem anderen Switch hat zumindest dazu geführt, dass ich das Firmware Update installieren konnte.
Ich bin jetzt also auf Version 0.965, die disconnects sind leider immernoch da.

apptime maxDly liefert jetzt HMLAN_KeepAliveCheck als Hauptprozess:

name                                     function                               max    count      total  average   maxDly   avgDly TS Max call     param Max call
tmr-HMLAN_KeepAliveCheck                 keepAliveCk                              0        4       0.09     0.02 55307.26 52406.22 09.02. 20:34:35 keepAliveCk:HMLAN1
tmr-HttpUtils_Err                        HASH_unnamed                            20        7      37.29     5.33 53338.07 33489.02 09.02. 20:34:35 HASH(0x55a96a659d40)
tmr-BlockingKill                         HASH_unnamed                             9       12      15.01     1.25 51911.43 47984.03 09.02. 20:33:45 HASH(0x55a969c0a0f8)
tmr-FW_closeInactiveClients              0                                        3        3       6.80     2.27 47605.58 47203.17 09.02. 20:37:18 0


Ich gucke mal, ob ich den Switch irgendwie runtergeregelt kriege.

ChrisK

So, nachdem ich heute Nacht auch für fhem alle Updates installiert habe, gibt es keine disconnects mehr. Verwirrt mich zwar ein bisschen, weil ich dachte der hmlan startet neu, unabhängig von fhem aber freut mich trotzdem.
Danke allen für die Hilfe und die Motivation nicht aufzugeben und einen Defekt einfach anzunehmen!


Zitat von: frank am 09 Februar 2020, 15:39:54
2. vccu definieren.
dann bekommst du zb ein überblick über nachbars homematic-zoo. ausserdem ist sie grundsätzlich zu empfehlen und erleichtert den "anstehenden" io-wechsel.
Das gehe ich als nächstes an. Vielleicht vorab die Frage: Wie kriegt man damit einen Überblick über Nachbars Geräte? Zeigt die vccu alle fremden Geräte an?