Raspi hängt sich nachts auf

Begonnen von petjek, 25 Februar 2018, 07:39:15

Vorheriges Thema - Nächstes Thema

petjek

Hallo zusammen,

seit ein paar Tagen stürzt mein Raspi über Nacht regelmäßig ab. Also nicht nur FHEM bleibt stehen, der Rechner ist auch per ssh nicht mehr zu erreichen. Hilft nur, den Stecker zu ziehen und neu zu starten. Ich kann keine Regelmäßigkeit erkennen. Passiert irgendwann zwischen Mitternacht und 5 Uhr morgens.
Ich habe keine Ahnung, wo ich denn nachgucken könnte was dazu führt. Könnt ihr mir einen Tipp geben?
Ich habe ein sysmon-Device angelegt, anbei ein paar Werte daraus (falls das hilft).

Date: 25.02.2018 07:35:58
CPU temperature: 46.5 °C
CPU frequency: 1000 MHz
CPU model name: ARMv7 Processor rev 5 (v7l)
BogoMIPS: 38.40
System up time: 0 days, 00 hours, 53 minutes
FHEM up time: 0 days, 06 hours, 06 minutes
Load average: 1.01 0.94 0.91
RAM: Total: 927.32 MB, Used: 217.04 MB, 23.41 %, Free: 491.30 MB
swap: Total: 100.00 MB, Used: 0.00 MB, 0.00 %, Free: 100.00 MB
Ethernet: RX: 62.70 MB, TX: 27.59 MB, Total: 90.29 MB
WiFi: not available
Filesystem /boot: Total: 42 MB, Used: 21 MB, 51 %, Available: 21 MB at /boot
Root: Total: 14997 MB, Used: 2991 MB, 21 %, Available: 11366 MB at /
USB-Stick: Total: 0 MB, Used: 0 MB, 0 %, Available: 0 MB at /media/usb1 (not available)

Danke schon mal für eure Hilfe.

petjek
Die Möglichkeiten der deutschen Grammatik können einen, wenn man sich darauf, was man ruhig, wenn man möchte, sollte, einlässt, überraschen.

Dr. Boris Neubert

Hallo,

ist der USB-Stick eingesteckt, der als nicht verfügbar gekennzeichnet ist?

Es besteht eine gewisse Wahrscheinlichkeit,  dass der USB abstürzt. Dann geht auch kein Netzwerk mehr.

Viele Grüße
Boris
Globaler Moderator, Developer, aktives Mitglied des FHEM e.V. (Marketing, Verwaltung)
Bitte keine unaufgeforderten privaten Nachrichten!

petjek

Zitat von: Dr. Boris Neubert am 25 Februar 2018, 08:39:58
Hallo,

ist der USB-Stick eingesteckt, der als nicht verfügbar gekennzeichnet ist?

Es besteht eine gewisse Wahrscheinlichkeit,  dass der USB abstürzt. Dann geht auch kein Netzwerk mehr.

Viele Grüße
Boris
Nein, ist kein USB-Stick dran. Ich habe jetzt mal den hier angepinnten Watchdog installiert und konfiguriert. Ich bin gespannt. Wobei das ja auch nur einen Symptombehandlung wäre.


Gesendet von iPhone mit Tapatalk
Die Möglichkeiten der deutschen Grammatik können einen, wenn man sich darauf, was man ruhig, wenn man möchte, sollte, einlässt, überraschen.

Wernieman

Monitor anschließen und gucken ...
Zusätzlich könntest Du die üblichen Verdächtigen kontrollieren:
/var/log/syslog, /var/log/kern.log

und load~1 ... was läuft alles auf der Kiste?
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

petjek

Ich muss zugeben, das mit dem load~1 sagt mir nichts.
Auf der Kiste läuft FHEM, JTradrfi, HABridge und AlexaFHEM.

Ich habe einen Blick in die beiden Logs geworfen. Aber außer dass er um 01:29:39 sein letztes Lebenszeichen von sich gegeben hat bis ich ihn dann um 06:43 Uhr wieder neugestartet habe erkenne ich da nichts besonderes. Aber vielleicht kann hier ja jemand etwas damit anfangen. Hab beide Dateien angehängt.

Vorhin ist er aber wieder im Abstand von 10 min abgeschmiert, der Watchdog hat aber gemacht was ich erwartet/gehofft habe und den Raspi neu gestartet.

LG
Arne

Nachtrag: Monitor anschließen ist keine Option weil hab keinen.
Die Möglichkeiten der deutschen Grammatik können einen, wenn man sich darauf, was man ruhig, wenn man möchte, sollte, einlässt, überraschen.

Wernieman

ZitatFeb 23 05:18:42 raspberrypi kernel: [  988.637508] Exception stack(0xb743de58 to 0xb743dea0)
Feb 23 05:18:42 raspberrypi kernel: [  988.678409] de40:                                                       7e8b537c b743df10
Feb 23 05:18:42 raspberrypi kernel: [  988.756079] de60: ffffffe8 00000000 00000000 b743df08 b743def8 7e8b537c 00000000 00000000
Feb 23 05:18:42 raspberrypi kernel: [  988.830626] de80: 00000001 b743dedc 00000018 b743deac 00000000 80453730 00000113 ffffffff
Feb 23 05:18:42 raspberrypi kernel: [  988.885849] [<8071a634>] (__dabt_svc) from [<80453730>] (__copy_to_user_std+0xd0/0x3c4)
Feb 23 05:18:42 raspberrypi kernel: [  988.949691] [<80453730>] (__copy_to_user_std) from [<80462ca4>] (arm_copy_to_user+0x28/0x2c)
Feb 23 05:18:42 raspberrypi kernel: [  989.029820] [<80462ca4>] (arm_copy_to_user) from [<80284d88>] (poll_select_copy_remaining+0x14c/0x1b8)
Feb 23 05:18:42 raspberrypi kernel: [  989.110831] [<80284d88>] (poll_select_copy_remaining) from [<80285bb0>] (SyS_select+0xf8/0x138)
Feb 23 05:18:42 raspberrypi kernel: [  989.191327] [<80285bb0>] (SyS_select) from [<801080c0>] (ret_fast_syscall+0x0/0x1c)
Feb 23 05:18:49 raspberrypi kernel: [  996.946828] w1_master_driver w1_bus_master1: Family 0 for 00.c80000000000.08 is not registered.

Also "Exception stack" hört sich nie gut an.

Auch self-detected stall" ist nicht gut
Feb 23 05:18:42 raspberrypi kernel: [  986.199291] INFO: rcu_sched "on CPU
Feb 23 05:18:42 raspberrypi kernel: [  986.240003] 1-...: (7876 ticks this GP) idle=ffb/140000000000001/0 softirq=40901/40901 fqs=3870
Feb 23 05:18:42 raspberrypi kernel: [  986.319464] (t=8403 jiffies g=26063 c=26062 q=2010)
Feb 23 05:18:42 raspberrypi kernel: [  986.359307] Task dump for CPU 1:


Was mich aber seeeehr beunruhigt:
ZitatFeb 23 05:17:15 raspberrypi kernel: [  902.291062] Internal error: Oops: 17 [#1] SMP ARM

Jetzt habe ich 2 Fragen:
1. Hast Du den Pi übertaktet? Bitte prüfen
2. Könntest Du mit einem andren Pi testen? Ich würde auf Hardware-Probleme Tippen, also
a) Stromversorgung (s.o.)
b) PI defekt
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

petjek

Zitat von: Wernieman am 25 Februar 2018, 20:19:57
Was mich aber seeeehr beunruhigt:
Jetzt habe ich 2 Fragen:
1. Hast Du den Pi übertaktet? Bitte prüfen
2. Könntest Du mit einem andren Pi testen? Ich würde auf Hardware-Probleme Tippen, also
a) Stromversorgung (s.o.)
b) PI defekt

Übertaktet habe ich ihn nicht, soweit ich mich erinnere. Ist ein Raspi2 und schon länger im Einsatz. In der raspi-config sehe ich nicht zufällig was gerade eingestellt ist? Wenn ich den Punkt aufrufe ist "None 900MHz" rot markiert aber das scheint mir die Default-Selektion zu sein.
Die Stromversorgung sollte nicht das Problem sein, da hängt ein 2500mA-Netzteil dran, mit dem er seit ca. 6 Monaten ohne Aussetzer funktioniert hat.
Ich habe gerade keinen anderen Raspi zur Hand. die anderen beiden werkeln mit anderen Jobs in meinem zweiten Wohnsitz vor sich hin.

Gerade gefunden: /boot/config.txt sagt arm_freq=1000. Also ja, ist übertaktet. Runtertakten?
Die Möglichkeiten der deutschen Grammatik können einen, wenn man sich darauf, was man ruhig, wenn man möchte, sollte, einlässt, überraschen.

Wernieman

JA ... und zusätzlich mal prophylaktisch Netzteil tauschen. Nur um erstmal Fehler einzugrenzen.

Mach doch mal ein lscpu. Dort soll u.A. stehen:
CPU max MHz:           900,0000

Wenn da 1000 steht ....
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

petjek

Ne, steht da nicht. Da steht 900. Hab gestern Abend schon auf 900 umgestellt und das Netzteil gegen ein 2000 mA Netzteil von meiner UE Boom angeschlossen (ich habe nur das eine 2500er Netzteil). Kein Neustart bis jetzt. Ich bin gespannt.
Interessant dass die raspi-config auch 1000 MHz anbietet. Aber ich meine auch gelesen zu haben, dass die Möglichkeit auf 1000 MHz irgendwann mal offiziell freigegeben wurde.


Gesendet von iPhone mit Tapatalk
Die Möglichkeiten der deutschen Grammatik können einen, wenn man sich darauf, was man ruhig, wenn man möchte, sollte, einlässt, überraschen.

Wernieman

Allerdings sollte man auf einem Produktivsystem (Stabilität wichtig!) keine Übertaktfunktion nutzen.

Wenn es jetzt erstmal läuft, könntest Du im 2. versuch auch mal Netzteil wieder zurücktauschen. Wenn es dann wieder Probleme gibt, war es das Netzteil. Wenn nicht, war es das Übertakten.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html