Komplettabsturz des Raspberry Pi

Begonnen von ritchie, 01 Juni 2014, 09:01:51

Vorheriges Thema - Nächstes Thema

ritchie

Hallo Zusammen,

seit ein paar Tagen habe ich Nachts (zu unterschiedlichen Zeiten) komplette Abstuerze des Raspberry Pi.

Das System ist nicht mal via ssh zu erreichen. Hier hilft nur der Hauptschalter.
Bis jetzt konnte ich in den Logs keine Hinweise finden.

Hat jemand eine Idee, wie ich der Sache Herr werden kann.

Gruss R.
IPU662  Ipfire & Fhem (Homematic + MAX) - Produktiv
Cubietruck (1Wire - USB) - Produktiv

ollir

wenn nichts im log zu sehen ist check erstmal die Stromversorgung.

Es gibt einige Einträge im Forum bezügl. Raspi und Netzteil.

VG

marc2

Moin !

Kann wir nicht vorstellen, dass das ein Problem mit den 1w Modulen ist, dann würde im Zweifelsfall maximal FHEM abstützen, aber nicht das gesamte OS. Wenn die üblichen Logs keinen Aufschluss geben, würde ich im ersten Schritt mal eine serielle Console anschließen und mitlaufen lassen.

Gruß, Marc 

ritchie

Hi,

zwar zeigt meine 5V Versorgung sauber 5.09 Volt am Ende des Stranges und eine Brummspannung von unter 10mV.
Gemessen mit Fluke Oszi. Ab trotzdem werde ich auch die Belastung des Sytems mal testen (Amperes der beiden Netzteile messen, ob ich hier im Grenzbereich bin).

Als als nächstes kommt ein Netzfilter ins System um Störungen von anderen Verbrauchern auszuschliessen, da diese Netzteile nicht sehr gut im filtern von Netzstörungen sind.

Gruss R.


IPU662  Ipfire & Fhem (Homematic + MAX) - Produktiv
Cubietruck (1Wire - USB) - Produktiv

Dr. Boris Neubert

Hallo,

ist wirklich der Raspi komplett abgestürzt (Kernel tot) oder ist nur die Netzwerkverbindung weg?

Letzteres kannst Du prüfen, indem Du ein Shell-Skript minütlich einen Rechner im Netz pingen läßt und das Ergebnis in eine Datei wegschreibst. Flush nicht vergessen.

Bist Du bzgl. Firmware/Kernel auf dem neuesten Stand? Ich hatte ursprünglich auch Probleme, die nach einem rpi-update weggingen.

Viele Grüße
Boris
Globaler Moderator, Developer, aktives Mitglied des FHEM e.V. (Marketing, Verwaltung)
Bitte keine unaufgeforderten privaten Nachrichten!

ritchie

Hi,

also die Last kann es nicht sein. Da 5V Netzteil kann 3A und hat eine Betriebslast von ca. 0,7A leicht schwankend. (+-0,04 A).

Lasse derzeit das System komplett aktualisieren (Linux und danach nochmals FHEM).

Gruss R.
IPU662  Ipfire & Fhem (Homematic + MAX) - Produktiv
Cubietruck (1Wire - USB) - Produktiv

ritchie

#6
Hallo Zusammen,

updates (Linux und FHEM) hat auch nichts gebracht.

War vor 10 Minuten noch Online auf der Maschine und dachte das läuft ja gut. Plötzlich System wieder tot.
Keine 1wire Kommunikation mehr (Sichtkontrolle an der Steurung, kein ssh). Neustart nur durch Aus-/Einschalten.

edit:
Hatte gerade einen Performancetest mittels "iperf" der Netzwerkverbindung durchgeführt. Hier scheint auch was nicht korrekt zu sein.
Habe zwei PI's aktiv, der eine hat 65MB/s zu meinem Desktop der andere (Problemfall) nur 6MB/s.
Hier sind die Kabel auch deutlich länger (Cat5 in den Keller).

Gruss R.
IPU662  Ipfire & Fhem (Homematic + MAX) - Produktiv
Cubietruck (1Wire - USB) - Produktiv

Dr. Boris Neubert

Hallo,

je nach den Grenzkosten Deiner Freizeit beginnt nun langwieriges Debugging, z. B. per remote syslog, oder Du kaufst für 29,95 EUR plus Versand einen neuen Raspi (oder was anderes, z. B. Cubietrack).

Viele Grüße
Boris
Globaler Moderator, Developer, aktives Mitglied des FHEM e.V. (Marketing, Verwaltung)
Bitte keine unaufgeforderten privaten Nachrichten!

ritchie

Hi,

es scheint so, das die Netzwerkverbindung in Ordnung ist. Ein Laptop hatte an der Netzwerkdose neben dem Rasp satte 95MB/s, was o.k. für eine 100MB Leitung.

Wenn es die Hardware sein sollte, kaufe ich mir lieber einen neuen Raspberry PI. Das ist mir meine Freizeit wert.

Gruss R.
IPU662  Ipfire & Fhem (Homematic + MAX) - Produktiv
Cubietruck (1Wire - USB) - Produktiv

Dr. Boris Neubert

Jo.

Bzgl. Netzwerk meinte ich den Adapter auf dem Board. Aber vermutlich bricht auch das Syslog ab, wenn der Rechner weg ist, selbst wenn Du noch 5 Stunden wartest, bevor Du rebootest.

Grüße
Boris

PS: irgendwie beruhigend, das nicht nur bei mir die IT unerklärliches Verhalten zeigt.


Globaler Moderator, Developer, aktives Mitglied des FHEM e.V. (Marketing, Verwaltung)
Bitte keine unaufgeforderten privaten Nachrichten!

corny456

Hatte mal ähnliche Probleme...

Pi bricht willkürlich zusammen, kein Zugriff mehr per ssh etc...

Bei mir war die SD wohl Hops...
Image der alten SD gemacht auf eine neue drauf und seitdem ist alles gut...


Sent from my iPad using Tapatalk HD

ritchie

#11
Hallo Boris,

>PS: irgendwie beruhigend, das nicht nur bei mir die IT unerklärliches Verhalten zeigt.
Das kenne ich. Geht mir eigentlich auch immer so.

Ein zweiter Raspberry PI zeigte die gleiche Bandbreite (Testsystem), daher scheint hier noch was anderes in der Konfiguration zu sein, was jetzt aber
nicht die Ursache sein kann. Da kümmere ich mich später drum.

Auch eine Vermutung könnten Störungen über das Spannungsnetz sein. Hier hatte ich mit einem Oszilloskope "Spike" von 1 Volt gesehen (runter auf 4Volt) für einige nano Sekunden,  wenn ich Licht angemacht hatte. Zwar läuft das System jetzt schon fast ein Jahr, ist aber über die Zeit gewachsen und hat jetzt fast seine erste volle Version

So hatte ich auf einem Feuchtesensor ständig Checksummen Fehler, daher die Fehlersuche schon seit langem.
Witzig ist, das ich seit dem Linux Update diesen Fehler nicht mehr habe (evtl. ist der owserver jetzt auch neuer).

@corny456
Danke für den Tip, werde ich auch noch machen. Würde ja nicht schaden.


Edit:
So, Neue SD Card mit Image aufgesetzt
USB Stick's nochmals gesichert, neu formatiert und wieder zurück gespielt.
Jetzt gehen die Tests wieder von vorne los.

Edit1:
Das System arbeitet seit dem Einsatz der neuen SDCard & dem Formatieren des USB Stick wieder korrekt.

Gruss R.


IPU662  Ipfire & Fhem (Homematic + MAX) - Produktiv
Cubietruck (1Wire - USB) - Produktiv

Bernhard

Seit ich das Modul für die Funktastatur abgezogen habe, läuft das Ding - seit Monaten

Bernhard

dan1180

Hallo zusammen,

ich glaube, ich habe ein ähnliches Problem und möchte deshalb (noch) keinen neuen Beitrag auf machen...

Zur Situation:
Ich betreibe meine 1wire Komponenten an einer 2ten FHEM-Instanz (beide auf einem Pi), die mittels fhem2fhem mit meiner Hauptinstanz kommuniziert. Weiter habe ich am Pi eine Festplatte (eigene Stromversorgung, USB an aktivem HUB) und über das Netzwerk einen HM-LAN-Konfigurator hängen.

Seit einiger Zeit hängt sich nun mein System in unregelmäßigen Abständen, zwischen 20 Min und 10 Std, auf (Überwachung mittels RPi Monitor). Mittels ausstecken der einzelnen Komponenten konnte ich herausfinden, dass die Abstürze nur dann vorkommen, wenn der DS2480 eingesteckt ist.
Komischerweise hat das System durchweg funktioniert, als ein Fehler in FHEM den Intervall der Temperatursensoren auf 9999 gesetzt hat (http://forum.fhem.de/index.php/topic,25431.0.html). Ein manuelles verkürzen des Intervalls (300, 600, 900) hat umgehend wieder zu einem Absturz geführt. Folgendes wurde ebenfalls getestet:


  • Stromversorgung wurde auf 2,1A mittels USB (nicht microUSB) geändert.
  • RasPi wurde ausgetausch.
  • SD-Karte wurde ausgetauscht.

Im Anhang ein LOG-File meiner FHEM-OWX-Instanz. Ich habe auch eines meiner Hauptinstanz, das ich bei Bedarf noch hochladen kann. Passt leider wegen der Größe nicht mehr in diesen Beitrag. Vielleicht findet ihr den Fehler aber schon hier...
FHEM 6.2 auf RPi4B
Raspberrymatic 3.X auf RPI3B

1xDS2408 und 6xDS18B20 an GPIO über Modul RPI_1Wire
>50 Homematic-Geräte

dan1180

Also in den Wintermonaten war hier mehr los... ;)

Ich habe inzwischen etwas experimentiert und mein OWX auf OWX_ASYNC umgestellt. Nun schaff ich immerhin schon fast 2 Tage  8)

Testweise habe ich auch mal den Netzstecker vom USB-HUB abgezogen (ich wollte einfach mal alles versuchen), was miene ON-Time wieder auf wenige Stunden reduziert hat.
Hätte ich irgend etwas umstellen müssen als ich von meinem selbstgebauten DS9097 auf den DS2480 gewechselt habe? Kann es Probleme mit meiner FHEM2FHEM Verbindung geben (woran ich nicht glaube weil die Kommunikation 2 Tage lang tut)?

Ich komm da echt nicht weiter weil ich im LOG keinen Fehler finde, die Abstürze extremst unregelmäßig sind und sich immer der ganze RasPi aufhängt (Ermittelt über RPi-Monitor/Uptime).

Gruß Dan
FHEM 6.2 auf RPi4B
Raspberrymatic 3.X auf RPI3B

1xDS2408 und 6xDS18B20 an GPIO über Modul RPI_1Wire
>50 Homematic-Geräte