RPi3 nicht zugreifbar - scheinbar extrem hohe plötzliche Systemlast

Begonnen von KölnSolar, 22 November 2016, 09:29:16

Spendierst Du mir einen?  8)

Irgendwann werde ich mir einen zulegen .. nur momentan brauche ich genug Hirnschmals für "neuen Job"
ich habe hier noch ein Raspi 3 als Testgerät rumliegen.
soll ich etwas testen.
Sag mir was ich machen kann/soll

Gruß Werner
Zotac CI547 32GB RAM 500GB SSD,ESXI 6.5, VM-Fhem5.8, VM-ioBroker, Cul 868Mhz;Cul 433Mhz = Busware, LGW, HM-MOD-RPI-PCB, Uniroll, IT YCR-100 TMT2100,ITR-1500, LD382 mit Wifilight, ESA 2000 + SENSOR WZ SET,FS20 TFK, HM-Sec-SC, HM-CC-RT-DN,PCA301,


Ups .. werner hilft werner ;o)

Nee ... ich sollte testen. Mangels RasPi kann ich nicht .. und ich glaube, Kernel-perf-monitoring dürfte auch nicht Deine Spezialität sein ;o)
Müsste mich selber auch "wieder" einlesen ..
ich habe jetzt ein altes tv-gerät an den videoausgang (3.5mm klinkenstecker) gehängt, um meldungen auf der konsole sehen zu können, falls das problem mit dem dateizugriff erneut auftritt. ich würde hier gerne das syslog und/oder kern.log in "echtzeit" verfolgen können. aber wie stelle ich das am besten an?

im augenblick nutze ich tail zur anzeige, haben aber die vermutung, dass hiermit ebenfalls keine anzeige zu bekommen sein wird, wenn das system keine dateizugriffe mehr erlaubt. irgendwie müsste man die signale abfangen und umleiten, bevor sie in die logs kommen. hat hierzu jemand eine idee?

gruss frank
Stichwort: syslog

Kann Dir da keine Patentlösung anbieten. Aber den Syslog kannst Du vieles "Beibringen". Siehe dessen Konfiguration.

Du müstest aber imm er noch einen unabhängigen Speicherplatz für die Logs haben. Es bringt nichts, sie "nur" abzugreifen ...
Zitat von: Wernieman am 05 Dezember 2016, 08:04:35
Stichwort: syslog

Kann Dir da keine Patentlösung anbieten. Aber den Syslog kannst Du vieles "Beibringen". Siehe dessen Konfiguration.

Du müstest aber imm er noch einen unabhängigen Speicherplatz für die Logs haben. Es bringt nichts, sie "nur" abzugreifen ...

allerdings ist es beim pi3/jessie_lite rsyslog.

*.*          /dev/console
mit dieser neuen zeile am anfang der rules section in /etc/rsyslog.config bekomme ich jetzt zumindestens automatisch alle meldungen zusätzlich auf den angeschlossenen tv. wahrscheinlich kann man sogar über das netzwerk versenden, mal schauen.

ich hoffe nun, dass beim auftreten des fehlers nicht zu viele meldungen kommen, sodass die ersten meldungen noch sichtbar sind, wenn ich den fehler bemerke, falls überhaupt etwas kommt.  ;)

nachtrag zu meinem "desaster":

nach meinem letzten reboot (stecker ziehen) wegen dem dateizugriffsproblem habe ich tagelang keinen zugriff mehr auf den pi bekommen. fhem wurde nicht gestartet und ssh war nicht möglich, obwohl sich der pi immer an der fritzbox angemeldet. auch mit einem neuen, aktuellen image auf anderer sd, war nichts möglich. ich habe alles erdenkliche in unterschiedlichsten konstellationen versucht: gehäuse entfernt, unterschiedliche umgebungstemperaturen, sd kontakte gereinigt und mehr kontaktdruck erzeugt, ethernet und/oder wlan, hmuart adapter platine vom gpio entfernt, ....

zum glück habe ich dann die möglichkeit zum anschluss eines tv bemerkt. denn exakt seit dem ersten einstecken des tv mit anschliesendem einstecken des netzteils funktioniert wieder alles normal, sogar mit beiden sd karten. so, als hätte es nie ein problem gegeben. das kann doch kein zufall sein, oder? kann ein nicht angeschlossener monitor theoretisch probleme verursachen?

oder kennt jemand einen pi-virus?

hast du deinen pi3 auch von elv?
elv keinesfalls. Ich meine von pollin.

Schon komisch manchmal diese Probleme. Bei mir lag es(Problem 2) ja irgendwie an einem USB-Hub und dessen Kabel. Irgendwie deshalb, weil der Pi3 jetzt wieder problemlos bootet, ohne dass etwas verändert ist.
Seit 5 Tagen läuft er nun und Problem 1("einfrieren") ist auch nicht wieder aufgetreten. Allerdings hab ich fhem ein paar mal rebootet wg. Neuentwicklungen.

Zitatkann ein nicht angeschlossener monitor theoretisch probleme verursachen?
Kann ich mir nicht vorstellen.
Grüße Markus
RPi3/2 buster/stretch-SamsungAV_E/N-RFXTRX-IT-RSL-NC5462-Oregon-CUL433-GT-TMBBQ-01e-CUL868-FS20-EMGZ-1W(GPIO)-DS18B20-CO2-USBRS232-USBRS422-Betty_Boop-EchoDot-OBIS(Easymeter-Q3/EMH-KW8)-PCA301(S'duino)-Deebot(mqtt2)-zigbee2mqtt


für den fall der fälle habe ich mir jetzt mal eine ramdisk eingerichtet und lasse den rsyslogd hier ebenfalls alle systemmeldungen speichern.
Zitatramdisk eingerichtet

Was bekanntlich nach einem reboot "weg" ist ... Du brächtest noch eine zusätzliche Sicherung
Zitat von: Wernieman am 07 Dezember 2016, 14:42:53
Was bekanntlich nach einem reboot "weg" ist ... Du brächtest noch eine zusätzliche Sicherung
schon klar.

da bisher "nur" der zugriff auf physikalische medien (sd-card oder usb-stick) unmöglich zu sein scheint, sonst aber alles etrem gut weiter läuft (einmal mindestens 10 tage bei mir), habe ich die hoffnung über eine direkt angeschlossene console am rpi, im fehlerfall zugriff auf die syslog datei in der ramdisk zu erlangen.

die letzte möglichkeit, die mir zur zeit einfällt, wäre, die systemmeldungen mit rsyslogd über tcp an einen anderen server zu senden, die dort dann von dessen rsyslogd eingesammelt und gespeichert werden. dazu fehlt mir derzeit das equipment.
Es gibt auch noch nfs etc. ... also mehrere Möglichkeiten. Da muß nicht gleich rsyslog ran ...
bei mir ist es gerade wieder passiert. auf der console kommen nun im 3s takt folgende syslog-meldungen vom kernel

mmc0: card never left busy state
mmc0: error -110 whilst initialising SD card

und ab und zu etwa folgendes

ext4-fs warning  ....  comm perl: error -5 reading directory block

leider sind das nur die auswirkungen und nicht der beginn des problems.
befehle über tastatus werden leider nicht angenommen:command not found.

da muss ich doch noch mal nfs probieren.
oh, shit :'(
ich hab seit Wochen Ruhe(nicht unken  ;))
unser Profi Werniemann hatte ja direkt die SD im Verdacht. Mir scheint, dass es nicht an der Hardware(Karte,Leser), sondern an der Software, also jessie, liegt. Warum sonst hab ich das Problem nicht mehr, obwohl ich als einzige Änderung nur ne leere SD eingeschoben habe ? Oder das Problem nach einem Reboot nicht mehr existent ist.
Wäre interessant, wenn Du auf USB umstellst und ne leere SD einlegst, ob Du dann auch problemfrei bleibst.
Viel Erfolg, Markus
RPi3/2 buster/stretch-SamsungAV_E/N-RFXTRX-IT-RSL-NC5462-Oregon-CUL433-GT-TMBBQ-01e-CUL868-FS20-EMGZ-1W(GPIO)-DS18B20-CO2-USBRS232-USBRS422-Betty_Boop-EchoDot-OBIS(Easymeter-Q3/EMH-KW8)-PCA301(S'duino)-Deebot(mqtt2)-zigbee2mqtt


Ich würde es nicht an jessie, sondern dem "RasPi-Kernel" die Schuld geben. Mir ist unter jessie so etwas nicht bekannt ...
ich hatte ja auch 3 wochen ruhe.  ;)

über google habe ich bisher noch nichts wirklich brauchbares gefunden. im wesentlichen auch spekulationen über den kernel und aussagen darüber, dass es nicht an der karte liegen kann, da diese auf anderen betriebssystemen anscheinend fehlerfrei funktioniert. ich habe eine sandisk ultra sdhc 32gb. mit welcher karte ist es bei dir aufgetreten, markus?

bei mir ist es jetzt 4x aufgetreten. 2x in abwesenheit und 2x während ich über ssh eingelogt war und mit apt-get gearbeitet habe. dieses mal bei apt-get update/upgrade mit folgenden bildschirmmeldungen:

dpkg: unrecoverable fatal error, aborting:
unable to open files list file for package `libboost-iostreams1.49.0': Input/output error
E: Sub-process /usr/bin/dpkg returned an error code (2)
E: Failed to write temporary StateFile /var/lib/apt/extended_states.tmp
root@raspberrypi:/home/pi# apt-get upgrade
bash: /usr/bin/apt-get: Input/output error
root@raspberrypi:/home/pi# reboot
bash: reboot: command not found

ich musste beide befehle 2x anstossen, bis alle listen/packages da waren. und am ende während "Preconfiguring packages ..." ist es dann passiert. zufall?

vielleicht noch ein hinweis.
da ich bluetooth mal nutzen wollte, war mir gestern durch den nachbar-thread aufgefallen das der hciuart.service beim letzten reboot vor ca 1 woche nicht automatisch von systemd gestartet werden konnte, also nicht lief. es scheint zufall zu sein, dass der service gestartet wird. kurz vor dem crash hatte ich ihn manuell gestartet. vielleicht gibt es hier einen zusammenhang.

läuft bei dir der hciuart.service, und/oder sollte er laufen und tut es nicht?

