(Gelöst) Absturzmeldung via Telegram?

Begonnen von is2late, 14 November 2020, 09:15:47

Vorheriges Thema - Nächstes Thema

is2late

Guten Morgen,

mein Raspi, auf dem (nur) FHEM läuft,  beliebt gelegentlich abzustürzen. Beim Frontend im Fully Browser verändert sich dann nichts, so dass zunächst  nicht auffällt, dass die Anzeigen nicht aktuell sind. Es wäre daher schön, wenn ich bei einem Absturz eine Meldung zB über Telegram bekäme. Ich stelle mir das so vor, dass ein zweiter Raspi den FHEM-Raspi regelmäßig abfragt. Gibt es keine Antwort, erfolgt eine Meldung über FHEM.

Hat jemand schon einmal so etwas realisiert oder eine Idee, wie das umzusetzen wäre?

Vielen Dank,
LG is2late
Pi4, Tahoma Jalousien, Hue, Echo, Sonos, Lupusec XT3, FritzBox

MadMax-FHEM

Stürzt fhem ab oder der PI?

Ist er in dem Zustand noch ping-bar oder per ssh erreichbar?

"Hängt" fhem "nur" oder ist fhem "weg"?
Also "ps -ax | grep fhem | grep -v fhem" zeigt nichts? Ebensowenig "sudo service fhem status"?

Es gibt auch lokale Lösungen:

- normalerweise startet systemd fhem neu, sobald der Prozess "weg" ist (bzw. kann das eingestellt werden)

- watchdog, der lokal schaut, ob eine bestimmte Datei sich "verändert". Wenn nicht: fhem neu starten

- ...

Bzgl. romote-Überwachung gibt es auch bereits einiges (mal suchen).
Hängt aber davon ab WAS nicht mehr geht (siehe Eingangsfragen)...

Wenn auch der PI nicht mehr per ping erreichbar ist (wahrsch. ist er das aber noch?), dann einfach einen 2ten fhem und ein PRESENCE-Device...

Für "Port-Überwacung" (also z.B. fhem-Port) gibt es auch Möglichkeiten (suchen).

Und du kannst ja auch zyklisch von einem 2ten fhem einen "dummy" abfragen und wenn das nicht mehr klappt -> Nachricht


ABER: ich würde ja die Ursache bekämpfen!!

fhem läuft bei mir seit Jahren OHNE einen Absturz (mal abgesehen von "durch meine Dummheit verursachte" [beim "Experimentieren"] ;)  )...

Weil wer sagt dir denn, dass nicht auch das "Überwachungs-fhem" mal "abstürzt"? ;)

Achja klar: einfach noch ein fhem das dann das überwacht (usw.) ;)

Gruß, Joachim
FHEM PI3B+ Bullseye: HM-CFG-USB, 40x HM, ZWave-USB, 13x ZWave, EnOcean-PI, 15x EnOcean, HUE/deCONZ, CO2, ESP-Multisensor, Shelly, alexa-fhem, ...
FHEM PI2 Buster: HM-CFG-USB, 25x HM, ZWave-USB, 4x ZWave, EnOcean-PI, 3x EnOcean, Shelly, ha-bridge, ...
FHEM PI3 Buster (Test)

is2late

Hallo Joachim,

vielen Dank für Deine Überlegungen und Tipps!

Also der Pi ist im beschriebenen Absturzfall überhaupt nicht mehr erreichbar. "Eigentlich" lief er in dieser Konfiguration seit Monaten ohne Beanstandung. Seitdem gab es zwei dieser Abstürze, also eigentlich nichts Wildes, aber wenn es mal zur Unzeit (zB im Alarmfall oä) passiert, wäre das natürlich doof. Vielleicht ein temporäres Hitzeproblem (Pi4 ohne Ventilator, sitzt in einem Regal...)
Ein einfacher Neustart des Pi bringt alles wieder in Ordnung. Nach Deinen Ausführungen dürfte dann ein zweiter Pi mit FHEM und PRESENCE-Device die einfachste Lösung sein, zumal parallel ohnehin ein zweiter Pi läuft, wenngleich ohne FHEM. Den zweiten Pi werde ich dann durch den Haupt-Pi überwachen  8)

Herzlichen Dank und noch ein schönes WE!
Pi4, Tahoma Jalousien, Hue, Echo, Sonos, Lupusec XT3, FritzBox

Christoph Morrison

Zitat von: is2late am 14 November 2020, 11:15:38
Also der Pi ist im beschriebenen Absturzfall überhaupt nicht mehr erreichbar. "Eigentlich" lief er in dieser Konfiguration seit Monaten ohne Beanstandung. Seitdem gab es zwei dieser Abstürze, also eigentlich nichts Wildes, aber wenn es mal zur Unzeit (zB im Alarmfall oä) passiert, wäre das natürlich doof. Vielleicht ein temporäres Hitzeproblem (Pi4 ohne Ventilator, sitzt in einem Regal...)

Wäre es dann nicht eher gut, den Pi mal ordentlich zu kühlen? Was sagt /var/log/messages nach so einem Absturz?

MadMax-FHEM

Da kann ich mich nur anschließen!

Ein PI4 OHNE Kühlung!! Und dann in einem Schrank!!

Was kommt nach einiger Laufzeit bei (zeigt, ob bereits runter getaktet wird bzw. ob irgendwelche "Hitze-Alarme" kamen):


sudo vcgencmd get_throttled


https://www.raspberrypi.org/documentation/raspbian/applications/vcgencmd.md


Bzw. was kommt bei (CPU-Temp, also dann noch durch 1000 teilen ;) ):


cat /sys/class/thermal/thermal_zone0/temp


oder (Temperatur "Grafik-Einheit"):


vcgencmd measure_temp


Also ich habe einen PI4 wo ich so ein "Komplett-Alu-Lüftungs-Gehäuse" habe, der liegt aber offen und ist selten in Gebrauch, ist so ein "Not-Desktop" ;)

Mein anderer PI4 (24h) läuft in einem Schrank aber mit (großem) Lüfter...

Gruß, Joachim

P.S.: oben genannte Werte "überwache" ich...
FHEM PI3B+ Bullseye: HM-CFG-USB, 40x HM, ZWave-USB, 13x ZWave, EnOcean-PI, 15x EnOcean, HUE/deCONZ, CO2, ESP-Multisensor, Shelly, alexa-fhem, ...
FHEM PI2 Buster: HM-CFG-USB, 25x HM, ZWave-USB, 4x ZWave, EnOcean-PI, 3x EnOcean, Shelly, ha-bridge, ...
FHEM PI3 Buster (Test)

is2late

Hi,

das Temperaturproblem war ja nur angedacht. Der Pi steht offen und die Kühlkörper sind nicht wirklich heiß.

Auf sudo vcgencmd get_throttled kommt throttled=0x0.

Die CPU-Temperatur beträgt 47,7 Grad und die der Grafik-Einheit 48 Grad. Vielen Dank übrigens für diesen Code zur Messung; kannte ich noch nicht!

Was sagt /var/log/messages nach so einem Absturz?
Da steht eine Menge Text... Vermutlich sollte ich nach den letzten Meldungen vor dem Neustart suchen... der war meiner Erinnerung nach zwischen 8 und 10:16 Uhr. Die letzten Meldungen vor 8:17 Uhr:
Nov 13 00:00:03 raspberrypi rsyslogd:  [origin software="rsyslogd" swVersion="8.1901.0" x-pid="324" x-info="https://www.rsyslog.com"] rsyslogd was HUPed
Nov 13 00:00:03 raspberrypi rsyslogd:  [origin software="rsyslogd" swVersion="8.1901.0" x-pid="324" x-info="https://www.rsyslog.com"] rsyslogd was HUPed
Nov 14 00:00:03 raspberrypi rsyslogd:  [origin software="rsyslogd" swVersion="8.1901.0" x-pid="324" x-info="https://www.rsyslog.com"] rsyslogd was HUPed
Nov 14 00:00:03 raspberrypi rsyslogd:  [origin software="rsyslogd" swVersion="8.1901.0" x-pid="324" x-info="https://www.rsyslog.com"] rsyslogd was HUPed
Nov 14 08:17:05 raspberrypi kernel: [    0.000000] Booting Linux on physical CPU 0x0


Sagt das etwas aus?

LG Ingo


Pi4, Tahoma Jalousien, Hue, Echo, Sonos, Lupusec XT3, FritzBox