Fast minütige freeze im Bezug auf HM keepalive

Begonnen von Fixel2012, 09 September 2017, 01:13:43

Vorheriges Thema - Nächstes Thema

Fixel2012

Servus,

ich seit 3 Tagen fast minütige freeze's feststellen müssen.

Bei Verbose 5 sehe ich, dass kurz vorher immer die keepalive abfrage von HM-Lan-gateway gestartet wird.

Ich nehme an das hängt damit zusammen? Kann das jemand bestätigen?

Wie lässt sich dieses Problem beheben?

2017.09.09 01:05:19 5: HMUARTLGW meinLGW checking credits (from timer)
2017.09.09 01:05:19 5: HMUARTLGW meinLGW send: 00 08
2017.09.09 01:05:19 5: HMUARTLGW meinLGW send: (8): fd00030002081430
2017.09.09 01:05:19 5: SW: 6025bb30aee68ea1
2017.09.09 01:05:19 5: HMUARTLGW meinLGW:keepAlive send (3): K3f
2017.09.09 01:05:19 5: SW: 5c9aac5bad
2017.09.09 01:05:19 1: Perfmon: possible freeze starting at 01:05:17, delay is 2.559


Komisch ist, dass Perfmon den freeze 2 Sekunden vorher angibt als der HM keepalive check.
Fhem 5.8 auf Raspi 3, HMLAN und 868MHz CUL mit einigen Komponenten, Z-Wave Rollladenaktoren, Tablet UI, 433 MHz CUL mit Baumarktsteckdosen und Temp Sensoren, Amazon Echo, Echo Dot, 2x SONOS  play1, 1x SONOS Connect AMP,  presence, HUE, Lightify

amenomade

Komisch ist es eigentlich nicht: laut Doku liest es sich so: um 01:05:17 hat sich der Performance Monitor selbst aufgerufen, der Befehl konnte erst um 01:05:09 (mit 2.559s Verspätung) ausgeführt werden - sprich nach dem Keepalive.

Also, deine Vermutung könnte schon richtig sein. Insb. wenn du nix anderes vor dem Keepalive in der Log hast.
Pi 3B, Alexa, CUL868+Selbstbau 1/2λ-Dipol-Antenne, USB Optolink / Vitotronic, Debmatic und HM / HmIP Komponenten, Rademacher Duofern Jalousien, Fritz!Dect Thermostaten, Proteus

Fixel2012

Ein reopen von dem HM-Lan-Gateway hat nicht geholfen. - Die Freeze's sind immernoch vorhanden.

Nach einem set HM-Lan-Gateway close sind ebenfalls immernoch freezes vorhanden.  ???
Fhem 5.8 auf Raspi 3, HMLAN und 868MHz CUL mit einigen Komponenten, Z-Wave Rollladenaktoren, Tablet UI, 433 MHz CUL mit Baumarktsteckdosen und Temp Sensoren, Amazon Echo, Echo Dot, 2x SONOS  play1, 1x SONOS Connect AMP,  presence, HUE, Lightify

amenomade

Kannst mit apptime sehen, ob tatsächlich deine HMLAN die Ursache ist (Spalte maxDly)
Pi 3B, Alexa, CUL868+Selbstbau 1/2λ-Dipol-Antenne, USB Optolink / Vitotronic, Debmatic und HM / HmIP Komponenten, Rademacher Duofern Jalousien, Fritz!Dect Thermostaten, Proteus

Fixel2012

name                                     function                               max  count    total  average maxDly TS Max call     param Max call
tmr-HUEBridge_GetUpdate                  HASH(0x2f90658)                         43    592    10633    17.96   4078 09.09. 05:38:05 HASH(HUEBridge)
tmr-SONOS_IsSubprocessAliveChecker       HASH(0x337a340)                         17   1756     6571     3.74   4041 09.09. 11:21:32 HASH(Sonos)
tmr-HMUARTLGW_CheckCredits               HMUARTLGW_CheckCredits:meinLGW          15   2364     8688     3.68   4033 09.09. 08:31:53 HMUARTLGW_CheckCredits:meinLGW
tmr-LIGHTIFY_poll                        HASH(0x457b290)                          4    587     1315     2.24   4009 09.09. 11:05:47 HASH(LightifyGateway)
tmr-HMUARTLGW_SendKeepAlive              HASH(0x61f5108)                          5   3535     7741     2.19   3994 09.09. 02:47:57 HASH(meinLGW:keepAlive)
tmr-SYSMON_Update                        HASH(0x41c5ef0)                         61    592    27825    47.00   3524 09.09. 08:32:25 HASH(SystemMonitor)
tmr-perfmon_ProcessTimer                 HASH(0x2073618)                         76  35936      677     0.02   3313 09.09. 05:38:05 HASH(0x2073618)
tmr-FW_closeInactiveClients                                                       8    618     1355     2.19   3075 09.09. 06:24:18
tmr-SONOSPLAYER_SimulateCurrentTrackPosition HASH(0x503e3a8)                         75   4193   194142    46.30   3031 09.09. 11:01:35 HASH(Sonos_Schlafzimmer)


das keepAlive vom Gateway ist jedenfalls weit oben dabei.

Wie kann ich der Sache weiter auf den Grund gehen?
Fhem 5.8 auf Raspi 3, HMLAN und 868MHz CUL mit einigen Komponenten, Z-Wave Rollladenaktoren, Tablet UI, 433 MHz CUL mit Baumarktsteckdosen und Temp Sensoren, Amazon Echo, Echo Dot, 2x SONOS  play1, 1x SONOS Connect AMP,  presence, HUE, Lightify

amenomade

mmm... in der Tat ist HMLAN nicht da. Kannst aber versuchen, die verschiedenen Modulen zu deaktivieren, bis Du keine Freeze mehr hast.
Pi 3B, Alexa, CUL868+Selbstbau 1/2λ-Dipol-Antenne, USB Optolink / Vitotronic, Debmatic und HM / HmIP Komponenten, Rademacher Duofern Jalousien, Fritz!Dect Thermostaten, Proteus

Fixel2012

Inzwischen ist in den Logs Komischerweise nichts mehr zu sehen.

Ich werde das weiter beobachten und mich zur Not melden.

Fhem 5.8 auf Raspi 3, HMLAN und 868MHz CUL mit einigen Komponenten, Z-Wave Rollladenaktoren, Tablet UI, 433 MHz CUL mit Baumarktsteckdosen und Temp Sensoren, Amazon Echo, Echo Dot, 2x SONOS  play1, 1x SONOS Connect AMP,  presence, HUE, Lightify

Darky

Hey zusammen,

bei mir verursacht das Sonos Modul ebenfalls starke Freezes in FHEM.
Mein System betreibe ich auf einem Raspberry Pi 3, Auszüge aus apptime:
name                                     function                               max  count    total  average maxDly TS Max call     param Max call
tmr-SONOSPLAYER_SimulateCurrentTrackPosition HASH(0x4ab4320)                        127   8244   492428    59.73   4459 16.12. 16:27:32 HASH(Sonos_Wohnzimmer)
tmr-SONOSPLAYER_SimulateCurrentTrackPosition HASH(0x49046a8)                        123   4945   286550    57.95   4407 16.12. 16:27:14 HASH(Sonos_Bad)
tmr-SONOSPLAYER_SimulateCurrentTrackPosition HASH(0x48c4280)                        120   4945   281937    57.01   4403 16.12. 16:26:07 HASH(Sonos_Kueche_2_RF)
tmr-SONOSPLAYER_SimulateCurrentTrackPosition HASH(0x4adc2d8)                        120   4945   285368    57.71   4407 16.12. 16:27:07 HASH(Sonos_Kueche)
tmr-SONOSPLAYER_SimulateCurrentTrackPosition HASH(0x4850540)                        118   4945   282281    57.08   4406 16.12. 16:26:05 HASH(Sonos_Bad_RF)
tmr-SONOSPLAYER_SimulateCurrentTrackPosition HASH(0x4ad1120)                        118   4947   282762    57.16   4460 16.12. 16:28:35 HASH(Sonos_Wohnzimmer_2_RF)
tmr-SONOSPLAYER_SimulateCurrentTrackPosition HASH(0x4875b68)                        114   6594   380555    57.71   4402 16.12. 16:26:46 HASH(Sonos_Kueche_2)
tmr-SONOSPLAYER_SimulateCurrentTrackPosition HASH(0x4872f18)                        102   1648    96109    58.32   4351 16.12. 16:27:32 HASH(Sonos_Wohnzimmer_2)


Beobachtungen sind, dass die CPU-Load über den top-Befehl konsistent auf 97-100% steht, Requests an FHEM und die Weboberfläche sind extrem langsam.
Nach dem Reboot ist das System kurz performant, bis die SONOSPLAYER mit FHEM kommunizieren und die CPU-Load wieder steigt.

Amenophis86

Wenn ich es richtig sehe, dann hast du 8 Sonos Boxen am laufen. Vielleicht kommt deine Hardware einfach irgendwann an seine Grenzen. Deaktiviere mal die ein oder ander Box und schau, ob es sich verbessert.
Aktuell dabei unser neues Haus mit KNX am einrichten. Im nächsten Schritt dann KNX mit FHEM verbinden. Allein zwei Dinge sind dabei selten: Zeit und Geld...

Darky

Zitat von: Amenophis86 am 20 Dezember 2017, 09:11:01
Wenn ich es richtig sehe, dann hast du 8 Sonos Boxen am laufen. Vielleicht kommt deine Hardware einfach irgendwann an seine Grenzen. Deaktiviere mal die ein oder ander Box und schau, ob es sich verbessert.

Ich habe mal ein bisschen rum probiert und diese Verbindung "Anzahl spielender Player" <-> "CPU Load" nachweisen können. Es dauert zwar nach dem stoppen einer Auswahl von Playern eine kurze Weile bis alle einhagelnden Events von diesem ruhen, aber dann pegelt sich die Last auf dem RasPi-CPU auch ein..
Dann wird wohl doch irgendwann eine NUC ins Haus kommen müssen :D
Grüße