Cubietruck: Watchdog nun fehlgeschlagen, funktionierte aber bisher....

Begonnen von Raven, 24 April 2016, 13:00:52

Vorheriges Thema - Nächstes Thema

Raven

Servus,

ich habe bereits hier das Sub-Forum und Internet durchsucht, aber bisher nichts verwertbares gefunden...

Mein Cubie läuft mit Igors Jessie 3.4.110-sun7i, LIPO-USV und Watchdog i.V.m. FEHM-Heartbeat.
Der Watchdog lief bei meinen Tests einwandfrei.
Allerdings blieb jetzt der Cubie während des Urlaubes hängen und der Watchdog griff nicht ein.  >:(
Nach dem Urlaub kam ich weder via SSH oder Konsole auf den Cubie.

Bei meinem letzten Urlaub blieb der Cubie ca. 3 Wochen nach dem letzten Reboot stehen.
Daraufhin konfigurierte ich den Watchdog und meine nun auch, daß der Cubie jetzt wieder nach 3 Wochen hängen blieb.

Ich bin ziemlich ratlos woran das nun hängen könnte....und wo ich suche könnte.
Ideen werden gerne angenommen. :-)
Danke vorab.
Proxmox-Prod/Dev: Homematic i.V.m. VCCU (HMLan, HM-MOD-RPI-PCB), Philips Hue, Viessmann (optolink)
Fritzbox 7590

Wernieman

sehe ich es richtig, das Dein Cubi komplett nicht erreichbar war? also auch kein ping o.Ä.?
Nach dem reboot jedoch war er wieder erreichbar?
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Raven

genau richtig: kein ping, garnichts. Nur noch die grüne FRONT-LED und die rote LED auf der Rückseite brannten.
Und nach dem Reboot war wieder alles normal.......auch der Watchdog fkte. wieder.
Das der Watchdog zuvor nicht fkte. ist meine größte Sorge im Hinblick auf weitere Urlaubsreisen...  8)

Igor meinte in meinen Thread in seinem Forum, daß die A20 CPU unter bestimmten Umständen instabil werden...
Tjo, ich hab jetzt erst mal Max-Freq auf 912 eingestellt und werde die nächsten 3-4 Wochen nichts am System machen (kein FHEM Update etc.) und dann weiter beobachten.

Meine 100% identische UAT läuft dagegen stabil, wird aber auch häufiger durchgestartet (bspw. FHEM) und hat natürlich keine HM-Komponenten zu bedienen.


Proxmox-Prod/Dev: Homematic i.V.m. VCCU (HMLan, HM-MOD-RPI-PCB), Philips Hue, Viessmann (optolink)
Fritzbox 7590

Wernieman

Kenne mich mit dem Cubietruck nicht so aus, deshalb bitte korrigieren, wenn ich falsch liege:

Wenn das System Grundlegend abschmiert, hilft Dir der watchdog auch nicht, da der auch per System realisiert.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Raven

Danke für diesen Hinweis!

Ich kenne den Cubietruck auch nicht im technischen Detail, aber Deine Aussage klingt plausibel und hatte ich nicht bedacht, da ich davon ausging, daß der Watchdog stärker vom restlichen System abgekoppelt ist.
Aber gut, habe jetzt noch wieder etwas wo nach ich googlen kann.

Danke nochmals!
Proxmox-Prod/Dev: Homematic i.V.m. VCCU (HMLan, HM-MOD-RPI-PCB), Philips Hue, Viessmann (optolink)
Fritzbox 7590

Navigator

Du könntest den Hardwarewatchdog scharf machen, der greift immer. Aber ich würde lieber die Ursache ausmachen. Seit ich die Stromversorgung optimiert habe und die FreqUtils auf 864 Mhz begrenzt habe laufen meine beiden Cubies zuverlässig durch. Kannst ja mal den Sysmon beobachten was die Voltage so macht. Unter 4,8 Volt werden die Dinger schon instabil.
Gruß aus Sachsen. FHEM auf Cubietruck. Vormals EZControl XS1 User.

Raven

Sehr gut und Danke für die weiteren Hinweise! Diese helfen mir bei der Fehlersuche weiter.

Die max Freq. habe ich jetzt zunächst mal auf 912 Mhz gesetzt. Okay, werde diese dann ggf. noch weiter runtersetzen.
Habe zwar ein Lipo noch angeschlossen, aber in der Tat werde ich die Voltage genauer beobachten!

Bzgl. HW-Watchdog bin ich nun überrascht.  :-\ Denn ich hab ja ein Watchdog konfiguriert und ich dachte dieser wäre dann auf expliziter HW-Ebene aktiv. Muss ich ggf. noch weitere Config-Einstellungen vornehmen?
Proxmox-Prod/Dev: Homematic i.V.m. VCCU (HMLan, HM-MOD-RPI-PCB), Philips Hue, Viessmann (optolink)
Fritzbox 7590

Wernieman

Wonach hast Du den den Watchdog konfiguriert?

"watchdog i.V.m. FEHM-Heartbeat" ist eigentlich ein SW-Watchdog ...
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Raven

Oh, sorry.
Ich habe den Linux Watch-Daemon im Einsatz und mit "watchdog i.V.m. FEHM-Heartbeat", wollte ich zum Ausdurck bringen, daß ich den Watchdog auf Datei-Änderungen (ausgelöst von Betateilchen's Heartbeat Ansatz) hin konfiguriert hatte.

Also gut, ich habe dann wohll den HW-Watchdog also bereits im Einsatz.  8)
Ist es dann nicht umso erstaunlicher, daß dieser nicht eingriff?
Und jetzt wird vielleicht ein Schuh raus, denn Igor meinte, daß sich U-Boot teilw. instabil verhält (und daher der Watchdog nicht fkte?)
Ich hab noch nach U-Boot gegoogelt, aber das ging schon arg über meine Kenntnisse hinaus, um die Zs.hänge zu verstehen.
Proxmox-Prod/Dev: Homematic i.V.m. VCCU (HMLan, HM-MOD-RPI-PCB), Philips Hue, Viessmann (optolink)
Fritzbox 7590

Wernieman

Nein, Du hast den Software-Watchdog im Einsatz, NICHT den Hardware!

Wenn also Dein System (Linux, Cubi) nicht mehr läuft, reift auch der Watchdog nicht meh, da diese Software auch nicht mher läuft.

Wie Du den Hardware-Watchdog konfigurierst must Du andere Fragen ...
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Raven

Danke Danke Danke für den erneuten sehr guten Hinweis!

Mein Googlen daraufhin ergab, daß die Aktivierung des HW-Watchdog nur mit dem neueren Kernel fkt.
Ich habe noch den alten Kernel (weil dieser das Booten vom NAND unterstützt - zumindest bei dem Igor Image) im Einsatz.

Evtl. gehe ich dann doch auf ein anderes Image.
Proxmox-Prod/Dev: Homematic i.V.m. VCCU (HMLan, HM-MOD-RPI-PCB), Philips Hue, Viessmann (optolink)
Fritzbox 7590