Pi stürzt alle 2-3 Tage ab - Grund für mich nicht erkennbar

Begonnen von Invers, 14 November 2017, 23:07:40

Vorheriges Thema - Nächstes Thema

Frank_Huber

Zitat von: Hollo am 15 November 2017, 12:35:51
Das kann man nicht pauschal so sagen.
Wie überall gibt es gute und schlechte Netzteile.

Ich habe es umgekehrt gemacht:
Ich versorge mit dem leistungsstarken guten NT, welches ich vorher für den Banana hatte, jetzt den aktiven USB-Hub, und der Banana hängt versorgungsmäßig auch am Hub.
So habe ich definitiv das identische Spannungspotential bei allen Devices und spare sogar ein Netzteil.
Wenn der Hub dann nicht limitiert...
Aber ja, generell geht das schon. Musst halt genau kucken sonst kanns schnell nach hinten los gehen.

Mit dem Handy online, daher kurz gefasst...


Wernieman

Wie immer, ist die Frage der Quallität. Es gibt gute und schlechte Netzteile und genau so gute und schlechte USB-Hubs. habe hier 2. An dem einen bekommt der Test-Pi nicht genügend Strom, am anderen läuft er super.

P.S. Qualität <> Preis.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Invers

Erst einmal danke ich euch für die wirklich zahlreichen Antworten.

Gerade wollte ich mich ans Werk machen  und alles von oben nach unten beantworten, da stürzt mein Pi erneut ab.
Aber diesmal wurde fhem ordentlich beendet?!?

Log:
2017.11.15 17:48:56 3: ENIGMA2 set Giga on
2017.11.15 17:49:02 0: ╔══════════════════════════════════════════════════════════════╗
2017.11.15 17:49:02 0: ║ Server shutdown                                              ║
2017.11.15 17:49:02 0: ╚══════════════════════════════════════════════════════════════╝
2017.11.15 17:49:02 0: Server shutdown
2017.11.15 17:49:02 1: Timeout for MPD_IdleStart reached, terminated process 12650
2017.11.15 17:17:05 3: telnetPort: port 7072 opened


Die Meldung im Rahmen habe ich damals eingebaut, damit ich Neustarts besser sehen kann, weil ich so schlecht gucken kann.

Wenn ich einen normalen shutdown mache, kommt also diese Meldung. Hab ich aber nicht. Habe gerade am PC meine Mails gelesen und bin auch erst vor kurzer Zeit nach Hause gekommen.


Manche Tage stürzt fhem gar nicht ab, dann wieder mehrmals täglich, dass nur einmal täglich oder es ist wieder ganz Ruhe. Immer wenn ich denke, nun geht wieder alles, dann haut er wieder einen raus.


@ ComputerZOO
Ich werde die Zeit nun von der Fritzbox holen, obwohl ich auch denke, dass es daran nicht liegt. Aber wenn man verzweifelt ist, probiert man besser alles.

@Wernieman
Ich habe den Watchdog nach hiesiger Anleitung konfiguriert. Es ist der WD des Pi und der startet nun einmal neu. Wie kann man das denn anders machen?

@Otto123
Deine Vermutung ist richtig, hilft aber nicht wirklich weiter.

@Frank_Huber
Das würde/wollte ich bereits sofort tun, aber bei den Modulen, die ich gesehen habe,. muss man noch irgendwelche Bautgeile dazukaufen und löten. Wenn du mir zeigst, welche Teile du genommen hast (Einkaufsliste) und vielleicht noch 3-5 Wörter dazu erklärst, dann mache ich das sofort. Egal, ob die Uhr Schuld hat, oder nicht.

@KölnSolar
Inzwischen bin ich da 100 Prozent deiner Meinung. Ich hatte die Lage leider vorschnell falsch analysiert. Logisch, dass du da Recht hast, denke ich.

@Frank_Huber
Nein, das siehst du falsch. Den Hub nutze ich nur, um die Sticks darüber mit Strom zu versorgen und den Pi somit zu entlasten, damit der sein Netzteil alleine nutzen kann.
Das Netzteil hatte ich bereits vorher erfolglos getauscht, der Fehler blieb.

Nun habe ich so  viele Antworten, weiss aber noch immer nicht, wie ich dem Fehler auf die Spur kommen soll/kann.

Tagelanges loggen ist vielleicht zu viel des Guten. Oder sehe ich das falsch?

Mir ist noch bei  den Zeiten was aufgefallen.
Der Pi startet immer mir

xx:17:05 in der Zeitangabe. also

2017.11.14 20:17:05 3: telnetPort: port 7072 opened
und
2017.11.15 00:17:05 3: telnetPort: port 7072 opened
und
2017.11.15 17:17:05 3: telnetPort: port 7072 opened

Das kann doch kein Zufall mehr sein, oder?

Pi3B+ mit SSD/ Bullseye | FB7590 AX | 12 x Dect200 | CUL433+868 | SDuino | HM-LAN | 3 x Heizung FHT + FKontakte | KeyMatic + 4 FB | HM Wandtaster 2-fach m. LED | 6 x Türkont. TFK-TI | HM-Bew.-Melder innen | 3 x Smoked. HM-SEC-SD-2

viegener

Das mit den Zeiten ist interessant - läuft denn in FHEM irgendetwas

Irgendetwas löst ja den shutdown in Deinem log aus - wenn Du kein at oder sonstiges realisiert hast, vermute ich den watchdog?

Grundsätzlich würde ich aber erstmal den watchdog deaktivieren, denn wie willst Du einen Hänger des Systems finden, wenn immer alle Beweise vernichtet werden (sprich restart). Vielleicht ist nicht FHEM sondern der watchdog Dein Problem


Kein Support über PM - Anfragen gerne im Forum - Damit auch andere profitieren und helfen können

Wernieman

Und dann mal in den entsprechenden Zeiten ins kern.log und syslog gucken. (/var/log/....)

z.B. sieht man manchmal auch, was den shutdown ausgelöst hat. Hier z.B. vor 2 Wochen, weil ich beim Aufreumen mit einem Kartong gegen den "Ausschaltknopf" des Zotac gekommen bin ... habe ich nicht gemerkt, aber im Logfile gesehen (ACPI-Event).

Also in diesem Falle, was steht in den Logfiles um den "2017.11.15 17:49:02"?
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

KölnSolar

Aber sind das nicht die "alten" Zeiten, also quasi der letzte "save" von Datum u. Uhrzeit vor dem Absturz ? Und Absturz würde ich es jetzt mal vorsichtig gar nicht nennen, denn der pi-watchdog löst ja aus, wenn ich Dich richtig verstanden habe. Und das tut er warum ?(Hab jetzt nirgends die watchdog-Definition gesehen). Ich spekuliere: weil FHEM eine Datei für den watchdog beschreibt, aber FHEM hängt  :-\
Wenn das zutreffend ist, dann würd ich den watchdog mal rausnehmen, wenn Du anwesend bist, also zeitnah verfolgen kannst, wann FHEM hängt. Dann nicht in Panik neu starten, sondern gucken, ob Du noch mit dem Browser auf FHEM kommst, noch mit telnet/ssh auf den PI kommst, wenn ja, was sagt dann top, fhem status.... wie sehen die timestamps der Logfiles aus, welches Log als letztes geschrieben, welcher timestamp hat das event. Kommst Du gar nicht mehr auf den PI, dann wenigstens noch einen ping probieren......Und vielleicht fallen den anderen noch weitere Prüfungen ein.....
RPi3/2 buster/stretch-SamsungAV_E/N-RFXTRX-IT-RSL-NC5462-Oregon-CUL433-GT-TMBBQ-01e-CUL868-FS20-EMGZ-1W(GPIO)-DS18B20-CO2-USBRS232-USBRS422-Betty_Boop-EchoDot-OBIS(Easymeter-Q3/EMH-KW8)-PCA301(S'duino)-Deebot(mqtt2)-zigbee2mqtt

Invers

Zitat von: KölnSolar am 15 November 2017, 18:51:52
Aber sind das nicht die "alten" Zeiten, also quasi der letzte "save" von Datum u. Uhrzeit vor dem Absturz ? Und Absturz würde ich es jetzt mal vorsichtig gar nicht nennen, denn der pi-watchdog löst ja aus, wenn ich Dich richtig verstanden habe. Und das tut er warum ?(Hab jetzt nirgends die watchdog-Definition gesehen). Ich spekuliere: weil FHEM eine Datei für den watchdog beschreibt, aber FHEM hängt  :-\
Wenn das zutreffend ist, dann würd ich den watchdog mal rausnehmen, wenn Du anwesend bist, also zeitnah verfolgen kannst, wann FHEM hängt. Dann nicht in Panik neu starten, sondern gucken, ob Du noch mit dem Browser auf FHEM kommst, noch mit telnet/ssh auf den PI kommst, wenn ja, was sagt dann top, fhem status.... wie sehen die timestamps der Logfiles aus, welches Log als letztes geschrieben, welcher timestamp hat das event. Kommst Du gar nicht mehr auf den PI, dann wenigstens noch einen ping probieren......Und vielleicht fallen den anderen noch weitere Prüfungen ein.....


Deine Vermutung ist richtig, fhem schreibt eine Datei, auf die dann der WD reagiert. Werde ich sofdort rausnehmen.

Diesen Teil deines Textes verstehe ich leider gar nicht. Kannst du bitte genauer sagen, was da gemeint ist und was ich machen soll?

Zitatwenn ja, was sagt dann top, fhem status.... wie sehen die timestamps der Logfiles aus, welches Log als letztes geschrieben, welcher timestamp hat das event.

@viegener
Das werde ich sofort machen.

@Wernieman
Damit bin ich als Linux-Blödel absolut überfordert. Ich hab gerade reingesehen, ist aber leider in englisch und zusätzlich noch alles unverständlich für mich.

Würde sich jemand bereit erklären, die beiden Dateien für mich zu durchforsten, oder ist das sehr aufwändig und somit als Bitte nicht zumutbar? Ich will auch niemanden nerven.

Pi3B+ mit SSD/ Bullseye | FB7590 AX | 12 x Dect200 | CUL433+868 | SDuino | HM-LAN | 3 x Heizung FHT + FKontakte | KeyMatic + 4 FB | HM Wandtaster 2-fach m. LED | 6 x Türkont. TFK-TI | HM-Bew.-Melder innen | 3 x Smoked. HM-SEC-SD-2

Otto123

die Startzeit xx:17:05 hat unter Umständen nichts mit FHEM zu tun. Das ist der cronjob für fake-hwclock. Da hat er das letzte Mal die Zeit festgehalten.

Also Du meinst zwar meine Bemerkung hilft nicht weiter, aber insofern schon: Nicht die Zeitverstellung ist das Problem, dass ist lediglich Symptom.


Gruß Otto
Viele Grüße aus Leipzig  ⇉  nächster Stammtisch an der Lindennaundorfer Mühle
RaspberryPi B B+ B2 B3 B3+ ZeroW,HMLAN,HMUART,Homematic,Fritz!Box 7590,WRT3200ACS-OpenWrt,Sonos,VU+,Arduino nano,ESP8266,MQTT,Zigbee,deconz

KölnSolar

#23
sagte ich doch. Diesmal bist Du "doppelt"  ;D ;D ;D

ZitatDiesen Teil deines Textes verstehe ich leider gar nicht. Kannst du bitte genauer sagen, was da gemeint ist und was ich machen soll?
top - ist ein Linux-Befehl der Dir eine Liste über die aktuell leistungsfressenden Prozesse ausgibt
fhem status -  na ja der Aufruf des fhem-Skripts: fhem start/stop/status
timestamps der Logfiles, welches Log als letztes geschrieben  - z.B. mit WinSCP ins Log-Verzeichnis von FHEM gucken. Sortierung absteigend nach Datum/Zeit
timestamp hat das event - z.B. mit WinSCP die Datei(Logfile) öffnen und zum letzten Eintrag scrollen

Edit:
ZitatWürde sich jemand bereit erklären, die beiden Dateien für mich zu durchforsten, oder ist das sehr aufwändig und somit als Bitte nicht zumutbar? Ich will auch niemanden nerven.
Stell sie einfach ein(anonymisiert, also keine IP, Passwort...) Wird schon jemand reingucken  ;)

RPi3/2 buster/stretch-SamsungAV_E/N-RFXTRX-IT-RSL-NC5462-Oregon-CUL433-GT-TMBBQ-01e-CUL868-FS20-EMGZ-1W(GPIO)-DS18B20-CO2-USBRS232-USBRS422-Betty_Boop-EchoDot-OBIS(Easymeter-Q3/EMH-KW8)-PCA301(S'duino)-Deebot(mqtt2)-zigbee2mqtt

Otto123

#24
doppelt erklärt besser  ;D ;D ;D

oder: zwei Formulierungen erklären vielleicht besser  ;)

Eigentlich gibt es aus meiner Erfahrung häufig nur zwei "unklare" Gründe die den pi "abstürzen" lassen: Stromversorgung und "Speicherfresser"  8)
Viele Grüße aus Leipzig  ⇉  nächster Stammtisch an der Lindennaundorfer Mühle
RaspberryPi B B+ B2 B3 B3+ ZeroW,HMLAN,HMUART,Homematic,Fritz!Box 7590,WRT3200ACS-OpenWrt,Sonos,VU+,Arduino nano,ESP8266,MQTT,Zigbee,deconz

Wernieman

Eigentlich war meine Anmerkung schon ein Angebot, Sie für Dich durchzusehen .. aber bitte "sinnvoll" kürzen und nicht komplett posten
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Invers

Zitat von: Wernieman am 15 November 2017, 20:20:35
Eigentlich war meine Anmerkung schon ein Angebot, Sie für Dich durchzusehen .. aber bitte "sinnvoll" kürzen und nicht komplett posten

Das wollte ich nicht so unverschämt voraussetzen. Danke dir.
Da ich nicht "sinnvoll" kürzen kann, weil ich ja nichts verstehe, hier mal im Anhang die beidenm kompletten Dateien.
Vielen Dank für deine Mühe im Voraus. Daumendrück.
Pi3B+ mit SSD/ Bullseye | FB7590 AX | 12 x Dect200 | CUL433+868 | SDuino | HM-LAN | 3 x Heizung FHT + FKontakte | KeyMatic + 4 FB | HM Wandtaster 2-fach m. LED | 6 x Türkont. TFK-TI | HM-Bew.-Melder innen | 3 x Smoked. HM-SEC-SD-2

Invers

Zitat von: Otto123 am 15 November 2017, 19:32:29
die Startzeit xx:17:05 hat unter Umständen nichts mit FHEM zu tun. Das ist der cronjob für fake-hwclock. Da hat er das letzte Mal die Zeit festgehalten.

Also Du meinst zwar meine Bemerkung hilft nicht weiter, aber insofern schon: Nicht die Zeitverstellung ist das Problem, dass ist lediglich Symptom.


Gruß Otto

Hatte ich verstanden, wollte ich auch in keinster Weise abwerten. Hab mich wohl blöd ausgedrückt. Ich meinte mehr, dass ich mit dem Tipp mein Problem nicht beseitigen kann.


@KölnSolar
Wieder was gelernt. Top kannte ich gar nicht. Den Rest schon, hatte ich aber tortzdem irgendwie nicht in der äusseren Hirnregion. :-) Natürlich kenne ich fhem start, stop, status. Tja, die Nerven und das Alter.

Beim nächsten Absturz werde ich das alles kontrollieren. Top habe ich schon getestet. Weiss nun, wie das geht.
Danke für deine Geduld, ich weiss, wie es ist, Ahnungslosen etwas vermitteln zu müssen. Lacht.

"Stell sie einfach ein(anonymisiert, also keine IP, Passwort...) Wird schon jemand reingucken"
Ups! Zu spät.
Pi3B+ mit SSD/ Bullseye | FB7590 AX | 12 x Dect200 | CUL433+868 | SDuino | HM-LAN | 3 x Heizung FHT + FKontakte | KeyMatic + 4 FB | HM Wandtaster 2-fach m. LED | 6 x Türkont. TFK-TI | HM-Bew.-Melder innen | 3 x Smoked. HM-SEC-SD-2

Frank_Huber

Zitat von: Invers am 15 November 2017, 18:27:19
@Frank_Huber
Das würde/wollte ich bereits sofort tun, aber bei den Modulen, die ich gesehen habe,. muss man noch irgendwelche Bautgeile dazukaufen und löten. Wenn du mir zeigst, welche Teile du genommen hast (Einkaufsliste) und vielleicht noch 3-5 Wörter dazu erklärst, dann mache ich das sofort. Egal, ob die Uhr Schuld hat, oder nicht.
Damit meinst Du das RTC Modul?
Ich hab dieses hier auf jedem PI stecken: https://www.ebay.de/itm/3-3V-5V-DS3231-High-Precision-RTC-Real-Time-Clock-Module-Arduino-Raspberry-Pi/401371719635
Einrichtung: http://www.raspberry-pi-geek.de/Magazin/2015/03/Echtzeituhr-Modul-DS3231-sorgt-fuer-genaue-Zeitangaben


Zitat von: Invers am 15 November 2017, 18:27:19
@Frank_Huber
Nein, das siehst du falsch. Den Hub nutze ich nur, um die Sticks darüber mit Strom zu versorgen und den Pi somit zu entlasten, damit der sein Netzteil alleine nutzen kann.
Das Netzteil hatte ich bereits vorher erfolglos getauscht, der Fehler blieb.
Ah, OK. das ist dann was anderes. Hatte verstanden Du betreibst den PI hinter dem Hub. Der PI darf gerne um die 5,1 Volt vom Netzteil bekommen.
je knapper das Netzteil an den 5V ist umso schneller kann es mal zu tief abrutschen bei Last.

viegener

Zitat von: Frank_Huber am 16 November 2017, 08:49:36
Ah, OK. das ist dann was anderes. Hatte verstanden Du betreibst den PI hinter dem Hub. Der PI darf gerne um die 5,1 Volt vom Netzteil bekommen.
je knapper das Netzteil an den 5V ist umso schneller kann es mal zu tief abrutschen bei Last.

Es gibt eine Liste von USB-Hubs, die mit dem PI getestet wurden (zum Teil auch zur Versorgung des Pi):
https://elinux.org/RPi_Powered_USB_Hubs

Ich weiss zwar nicht wie gut die Versorgungslage für diese Hubs noch aussieht, denn ich habe die Liste schon vor einiger Zeit aufgetan, aber vielleicht hilft sie ja jemandem, denn es gibt leider immer noch Hubs, die hier Probleme machen (Stichwort back power).

Kein Support über PM - Anfragen gerne im Forum - Damit auch andere profitieren und helfen können