Cubietruck bleibt plötzlich öfters scheinbar grundlos stehen.

Begonnen von duke-f, 13 Juni 2016, 13:25:41

Vorheriges Thema - Nächstes Thema

duke-f

#15
Weiß das jemand: Hat der Vanilla-Kernel den Watchdog integriert?
Cubietruck, 3 Raspberry Pis,
CUL868, RFXtrx433, CUL433, SCC868, HM-USB,
IRTrans, EZcontrol XS1, IguanaWorks USB IR Transceiver
ESPEasy, Fritz!Box, Samsung TV+BD, LMS, Squeezelite

duke-f

Zitat von: Raven am 17 Juni 2016, 12:23:37
Ich war auch betroffen.
Bei mir half das runtertakten und seitdem (2.Monate) keine Probs mehr (zuvor jeden Monat).

Ja, leider der Hardware-Watchdog ist nicht in allen Images verfügbar.

Und nachinstallieren geht nicht?
Cubietruck, 3 Raspberry Pis,
CUL868, RFXtrx433, CUL433, SCC868, HM-USB,
IRTrans, EZcontrol XS1, IguanaWorks USB IR Transceiver
ESPEasy, Fritz!Box, Samsung TV+BD, LMS, Squeezelite

Tobias

Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

duke-f

... back to the roots, kann man da sagen. Hätte ich auch selber drauf kommen können. Schließlich hatte ich ja auch meine positiven Erfahrungen mit Igor bezüglich Rückfragen.

Danke für den Tipp.
Cubietruck, 3 Raspberry Pis,
CUL868, RFXtrx433, CUL433, SCC868, HM-USB,
IRTrans, EZcontrol XS1, IguanaWorks USB IR Transceiver
ESPEasy, Fritz!Box, Samsung TV+BD, LMS, Squeezelite

Raven

Danke auch von meiner Seite!
mmhhh...ggf. führe ich den Kernel-Upgrade durch, obwohl mein System nach begrenzen der CPU-Taktfrequenz nun stabil läuft.
Allerdings hat mein Cubie nun in der Sommerzeit im Hinblick auf Heizungssteuerung auch weniger zu tun.
Meine Heizungssteuerung läuft über USB und nicht auszuschliessen, daß dies die Ursache für die Abstürze war.
Cubietruck-Prod: HM-LAN, Heizung, Rolläden, Schalter, Viessmann (optolink)
Cubietruck-DEV:
Fritzbox 7490

duke-f

@Tobias:
Eine Frage habe ich die ganze Zeit immer wieder vergessen: Habe ich das richtig verstanden, dass Du das Problem auch beim Kernel 3.4.112 hast? Dann kann ich mir den Versuch eines Upgrades ja eigentlich sparen. Hab das am WE zwar mal kurz versucht, bin aber doch wieder zurück auf 3.4.107, weil ich den Watchdog vermisst habe.

Bei mir kommt mir das komisch vor, weil sich das Problem so akut erst die letzten Wochen gab, nachdem der Cubie doch fast jahrelang nahezu problemlos lief.
Cubietruck, 3 Raspberry Pis,
CUL868, RFXtrx433, CUL433, SCC868, HM-USB,
IRTrans, EZcontrol XS1, IguanaWorks USB IR Transceiver
ESPEasy, Fritz!Box, Samsung TV+BD, LMS, Squeezelite

Tobias

auch mit dem neuen Kernel hatte ich das hägen-bleiben Problem.

Seit dem ich die CPU Frequenz wie beschrieben begrenzt habe, rennt er seit 1. Monat durch...
Und ja, vorher lief er bei mir ohne anpassungen und Änderungen auch fast 2 Jahre durch...

Die Ausfälle auf meinem Cubie #1 traten erst vor ca 5 monaten auf...
Zuerst war der Bootloader im NVRam zuerschossen -> jetzt boot von sd-Karte
Dann waren alle Module des Kernels "weg" -> Kernelupdate incl aller Module um ein lauffähiges System wieder zu haben
Dann Instabilitäten -> CPU Begrenzung
Jetzt Stabil


Auf meinem Cubie #2 traten sie erst nach meinem Umzug vor ca 4 Monaten auf, vorher rannte er ca 6 monate sauber durch.
Auch hier half der CPU Begrenzer
Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

duke-f

Okay, dann könnte es eine Art Hardware-Verschleiß sein und ein neuer Kernel kann ich mir sparen.
Cubietruck, 3 Raspberry Pis,
CUL868, RFXtrx433, CUL433, SCC868, HM-USB,
IRTrans, EZcontrol XS1, IguanaWorks USB IR Transceiver
ESPEasy, Fritz!Box, Samsung TV+BD, LMS, Squeezelite

duke-f

#23
Interessant - ich lasse jetzt minütlich die Heartbeatdatei antouchen und zudem den Zeitpunkt darin loggen. Dem Watchdog habe ich 20 Minuten gegeben, vor er neu starten soll. Nun startete der Cubie heute abend tatsächlich wiedermal neu - die Zeit wird aber ununterbrochen in der Datei geloggt. Also hat irgendetwas anderes den Neustart verursacht, wie mir scheint. :o

17:36:13 war der Neustart.
Auszug aus der fhem.heartbeat:

...
Wed Jul 20 17:29:59 CEST 2016
Wed Jul 20 17:30:59 CEST 2016
Wed Jul 20 17:32:00 CEST 2016
Wed Jul 20 17:32:59 CEST 2016
Wed Jul 20 17:33:59 CEST 2016
Wed Jul 20 17:35:01 CEST 2016
Wed Jul 20 17:37:47 CEST 2016
Wed Jul 20 17:38:47 CEST 2016
Wed Jul 20 17:39:47 CEST 2016
...
Cubietruck, 3 Raspberry Pis,
CUL868, RFXtrx433, CUL433, SCC868, HM-USB,
IRTrans, EZcontrol XS1, IguanaWorks USB IR Transceiver
ESPEasy, Fritz!Box, Samsung TV+BD, LMS, Squeezelite

frank

Zitatdie Zeit wird aber ununterbrochen in der Datei geloggt.
ich vermisse aber ca. 17:36:00
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

duke-f

Ja, da vermute ich aber, dass die im Neustart untergegangen ist. Die von mir angegebene Zeit des Neustarts war aus der syslog. Kann es sein, dass es ca. 15 Sekunden lang dauert, bis die ersten Daten in die syslog kommen?
Cubietruck, 3 Raspberry Pis,
CUL868, RFXtrx433, CUL433, SCC868, HM-USB,
IRTrans, EZcontrol XS1, IguanaWorks USB IR Transceiver
ESPEasy, Fritz!Box, Samsung TV+BD, LMS, Squeezelite

frank

ich würde den reboot mal provozieren, indem ich den touch verhindern würde. dann siehst du ja, was in dem fall zb im sys.log steht und wie sich die zeiten verhalten.
keine ahnung was der watchdog genau veranlasst. vielleicht wird ja noch versucht, einigermassen "human" runterzufahren, was dann ja auch zeit kosten sollte.
FHEM: 6.0(SVN) => Pi3(buster)
IO: CUL433|CUL868|HMLAN|HMUSB2|HMUART
CUL_HM: CC-TC|CC-VD|SEC-SD|SEC-SC|SEC-RHS|Sw1PBU-FM|Sw1-FM|Dim1TPBU-FM|Dim1T-FM|ES-PMSw1-Pl
IT: ITZ500|ITT1500|ITR1500|GRR3500
WebUI [HMdeviceTools.js (hm.js)]: https://forum.fhem.de/index.php/topic,106959.0.html

duke-f

Gute Idee. Morgen geht's erst mal in Urlaub, aber vielleicht habe ich von Unterwegs mal Gelegenheit für einen solchen Test.
Cubietruck, 3 Raspberry Pis,
CUL868, RFXtrx433, CUL433, SCC868, HM-USB,
IRTrans, EZcontrol XS1, IguanaWorks USB IR Transceiver
ESPEasy, Fritz!Box, Samsung TV+BD, LMS, Squeezelite

Tobias

Mit den CPU Anpassungen rennen beide cubies schon 46 Tage durch. War vorher undenkbar

Gesendet von meinem Leap mit Tapatalk

Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

Raven

CPU angepasst und der Cubie lief 4 Monate durch, aber jetzt in den letzten 4 W zwei Total-Ausfälle (nur Reboot möglich).

Ich würde gerne dem HW Watchdog nochmals eine Chance geben, verstehe aber die Installation nicht.

Lt. Igor wird die erforderliche Funktionalität (Aktivierung des Watchdogs für ARCH_SUN7I) im nächsten Kernel-Update integriert:
http://forum.armbian.com/index.php/topic/211-kernel-update-procedure-has-been-changed/?p=10947

Aber auch eine eigene Kompillierung wäre möglich:
http://forum.armbian.com/index.php/topic/211-kernel-update-procedure-has-been-changed/?p=11132

Die Kompilierung-Option erscheint mir sehr komplex. Das Kernel-Upgrade habe ich daher durchgeführt, bin mir aber nicht sicher, ob nun die o.g. Fkt. nun tatsächlich enthalten ist, bzw. wie ich diese - falls nun vorhanden - aktiviert werden muss; d.h. welches Modul müsste ich laden. Die Konfiguration der watchdog.conf traue ich mir zu.

danke vorab.
Cubietruck-Prod: HM-LAN, Heizung, Rolläden, Schalter, Viessmann (optolink)
Cubietruck-DEV:
Fritzbox 7490