Ich schmeiß das Igor-Image wieder von meinem CT runter

Begonnen von betateilchen, 12 September 2014, 11:24:39

Vorheriges Thema - Nächstes Thema

hexenmeister

#15
Habe igors Image mit 3.4.98 Kernel drauf. Läuft stabil, noch keine Abstürze. Gerade sind es 27 Tage. Davor habe ich selbst rebootet.

Edit: CPU Freq: 1000, Temp. Dauerhaft knapp unter 40. 44 in der Spitze (nächtlicher Backup-Lauf)

HCS

Mein Produktivsystem läuft wochenlang (zwischen freiwilligen Reboots wg. Konfigurationsänderung, ...) ohne Probleme. Noch nie ein Absturz.

Mein Testsystem hatte das kürzlich innerhalb von zwei Tagen zwei mal. Einfach stillgestanden. Kein Heartbeat mehr. Reset gemacht und es ist wieder hochgefahren.
Das Testsystem hat aber auch schon hart durchmüssen, und da hatte ich (im Gegesatz zum Produktivsystem) LXDE drauf. LXDE deinstalliert und seit einer Woche nichts mehr passiert, was allerdings noch zu kurz ist, um es als "geheilt" zu betrachten.

Das Produktivsystem macht sogar deutlich mehr als das Testsystem (NAS, heftige Backups nachts, Intranet, ...)

Beide Kernel 3.4.103
Beide bootfs im NAND und rootfs auf einer 128GB SSD
kein wlan
kein bluetooth
nichts an GPIO
JeeLink an USB
Beide mit Akku

Temperatur Produktivsystem ca. 45° im Schnitt, nachts bei hoher Last ca. 50
Temperatur Testsystem ca. 38° im Schnitt, bei Last ca. 45

juppzupp

Meiner hat nicht viel zu tun, und ist immer um 30° warm



Load: 0.10, 0.07, 0.05 - Board: 28.2°C - Drive: sensor / 41Gb - Memory: 1896Mb

root@cubie:~# cat /sys/devices/system/cpu/cpu0/cpufreq/stats/time_in_state | grep -v '\ 0'
480000 303126362
528000 278066
600000 14349
648000 2971
672000 1332
696000 1284
720000 1408
744000 1317
768000 1202
816000 2642
864000 4255
912000 10188
960000 4050
1008000 20195303
root@cubie:~#

stromer-12

Meiner hier im wird 42.5 °C warm und arbeitet zwischen 60MHz und 1200MHz
Er ist per WLAN im Netz und hat eine CUL868 an USB, FHEM und mySQL laufen auf SSD.


Load: 0,08, 0,07, 0,05 - Board: 42.6°C - Drive: 36°C / 87Gb - Memory: 1747Mb

root@cubietruck:~# cat /sys/devices/system/cpu/cpu0/cpufreq/stats/time_in_state | grep -v '\ 0'
60000 82767698
72000 3945903
84000 30226
96000 25901
120000 35797
132000 25478
144000 16274
156000 16761
168000 11513
180000 17430
192000 6651
204000 5547
216000 8928
240000 86034
264000 44058
288000 16795
336000 18949
360000 6458
384000 4772
408000 4481
480000 11231
528000 7612
600000 12308
648000 8766
672000 4159
696000 4448
720000 4532
744000 3420
768000 3754
816000 6955
864000 7099
912000 9609
960000 9370
1008000 13944
1056000 32954
1104000 68341
1152000 133720
1200000 6280716
FHEM (SVN) auf RPi1B mit HMser | ESPLink
FHEM (SVN) virtuell mit HMLAN | HMUSB | CUL

HCS

@betateilchen: füg doch mal eine Umfrage hinzu: "Mein System ist schon mal im laufenden Betrieb einfach stehen geblieben" Ja / Nein

Wäre interessant, wie hoch der Prozentsatz der Systeme ist, bei denen das passiert.
Aus den Antworten ist das schwer rauszuzählen.

Nachdem ich schon zwei Cubietriucks auf dem Tisch hatte, die nach einigen Tagen/Wochen einfach gestorben sind, würde ich auch Hardwareprobleme nicht völlig ausschließen.

joshi04

#20
Wenn Ihr das Igor-Image einsetzt, liefern Freq. und Temp wohl keine eindeutige Erklärung für die Instabilitäten.

Als Vergleich, bei mir liegt die CPU-Temp im Schnitt bei 47°C. Es ist auch ne SSD im Gehäuse und die CPU-Freq. ist zwischen 720-920Mhz (bin noch nicht zum optimieren gekommen) und ggf. ist der Aufstellungsort ungünstiger. Seit Einrichtung gab es keine unvorhersehbaren Abstürze.

Mein Image kam hier her:
Zitat von: betateilchen am 20 März 2014, 23:50:09
das Image liegt hier: http://dl.cubieboard.org/software/a20-cubietruck/debian/debieez/

...Wie gesagt, ein Schuss ins Blaue.
NUC: 2xJeeLink, PCA301/TX35DTH; HueBridge, LivingColors; vair-monitor (CO2); HMLan, Winmatic, HM-CC-RT-DN, HM-TC-IT-WM-W-EU, HM-ES-TX-WM, HM-WDS10-TH-O, HM-ES-PMSw1-Pl, HM-SEC-SC-2, HM-SEC-SCo; AVM DECT 200; panStamp; smartVISU

moonsorrox

#21
meiner läuft mit einer CPU Frequenz von 1008 MHz Temperatur im Schnitt 41°, ich habe eine 60GB SSD von Kingston im Einsatz.
System up time: 17 Tage
alle Daten hier aus Sysmon...
macht Nachts zwei Backups..
Alles davor an reboots selber ausgelöst, stehen geblieben ist er noch nie.
Hier die Daten beim Login:
Load: 0,08, 0,06, 0,05 - Board: 41.0°C - Drive: 39°C - Memory: 1922Mb


Mein zweiter CT arbeitet als reiner Mediaserver mit dem Logitech Media Server drauf, hier habe ich eine 2,5" 1TB WD Red dran und meine gesamte Musik drauf, hier Streame ich ständig Musik....
Nach der Installation überhaupt noch nie rebootet, kein Abstürze

Hier die Daten beim Login:
Load: 0,00, 0,01, 0,05 - Board: 31.4°C - Drive: 36°C - Memory: 1844Mb
Intel-NUC i5: FHEM-Server 6.1 :: Perl v5.18.2

Homematic: HM-USB-CFG2,HM-CFG-LAN Adapter, HM-LC-BL1-FM, HM-LC-Sw1PBU-FM, HM-LC-Sw1-PI-2, HM-WDS10-TH-O, HM-CC-TC, HM-LC-SW2-FM

GiJoe73

#22
Hallo,

Mein Cubietruck zickt mit dem Igor Image auch rum. Bemerkt habe ich das allerdings erst als ich FHEM das Push Nachrichten senden gezeigt habe und seitdem bekomme ich alle 2 - 4 Tage eine Nachricht über einen Neustart :(

In einem anderen Forum habe ich von ähnlichen Problemen gelesen und das die CPU Probleme macht wenn man diese übertaktet. Daher haben die in der /etc/init.d/cpufrequtils die max Frequenz auf 960 MHz begrenzt.

(Fehler korrigiert - entschuldigt das ich das nicht kontrolliert habe)
FHEM 5.5 auf Cubietruck mit 60GB SSD
HMLAN - CFG - Adapter
11 x HM-LC-Bl1PBU-FM
8 x HM-CC-RT-DN
2 x 1-Wire Bus mit 8 stk. DS2406, 3 x 1-Wire Dougie Counter, 2 x DS2408, 8 x DS18B20, 1 x DS2450, 2x DS2438

HCS

Zitat von: GiJoe73 am 14 September 2014, 16:46:42
In einem anderen Forum habe ich von ähnlichen Problemen gelesen und das die CPU Probleme macht wenn man diese übertaktet. Daher haben die in der /etc/.init.d/cpufrequtils die max Frequenz auf 960 MHz begrenzt.
Das kann schon eine plausible Erklärung sein. Laut SUNXI hat die A20 eine Maximalfrequenz von 912 MHz.
Per default ist der governor beim "igor-image" auf 480-1010 eingestellt, was übertaktet ist.
Mit etwas fertigungsbedingter Streuung kann dann vielleicht die eine oder andere CPU bei 1010 MHz instabil werden und andere packen das noch.

Ich drehe mal auf 912 MHz runter und warte ab, ob nochmal was passiert.

marvin78

Bei mir laufen alle 3 CTs auf konstant 1010Mhz seit Wochen (teilweise Monaten) stabil.

moonsorrox

Zitat von: HCS am 16 September 2014, 14:11:29
Ich drehe mal auf 912 MHz runter und warte ab, ob nochmal was passiert.

meiner läuft auch konstant bei 1008 MHz

wo machst du das, in dieser Datei hier die oben erwähnt wurde steht nämlich nichts drin /etc/.init.d/cpufrequtils
Intel-NUC i5: FHEM-Server 6.1 :: Perl v5.18.2

Homematic: HM-USB-CFG2,HM-CFG-LAN Adapter, HM-LC-BL1-FM, HM-LC-Sw1PBU-FM, HM-LC-Sw1-PI-2, HM-WDS10-TH-O, HM-CC-TC, HM-LC-SW2-FM

HCS

Zitat von: moonsorrox am 16 September 2014, 15:27:22
wo machst du das, in dieser Datei hier die oben erwähnt wurde steht nämlich nichts drin /etc/.init.d/cpufrequtils
/etc/.init.d/cpufrequtils ist auch falsch. Da ist ein Punkt zu viel, vor init

chris1284

das selbe hier mit igor-image:
- Reboot /Ausfälle bisher nur bei Stromausfällen (hatte noch kein Akku) oder gewollten Reboot (sowohl mit root auf NAND sowie root auf HDD)
- konstant 1008 MHz bei 40°C mit Akku und 1TB HDD (Nas) im Cubiecase
- Bluetooth, WLAN, LAN aktiv, USB-Ports voll belegt mit Geräten ohne eigene Stromversorgung

betateilchen

Ich habe jetzt einen CT mit Igor Image testweise so konfiguriert, dass die /etc/init.d/cpufrequtils überhaupt nicht ausgeführt werden. Dann ist die scaling_max_freq automatisch auf 912 MHz begrenzt. Das ganze Frequenz-Gedöns wird ja grundsätzlich über die script.bin festgelegt und von den cpufrequtils während des Bootens verändert.

Der Effekt der sich bei mir bei jedem Absturz zeigt, war ein Dauerleuchten der weissen LED, diese LED ist der CPU1 zugeordnet und signalisiert CPU-Aktivitiät. (die orange LED ist der CPU0 zugeordnet).

Bin gespannt, ob sich der CT dadurch stabil verhält.
-----------------------
Formuliere die Aufgabe möglichst einfach und
setze die Lösung richtig um - dann wird es auch funktionieren.
-----------------------
Lesen gefährdet die Unwissenheit!

Navigator

Die ersten Images von Igor waren bis zur 3.4.79 doch noch bis 1200Mhz getaktet, das hat Igor wegen Stabilitätsproblemen wohl wieder zurückgenommen. Ich selbst habe das von Anfang an wieder runtergenomen und keine Probleme mit Neustarts, jedoch hängte sich der LMS Server beim Start in einer Endlosschleife fest und es war ein Krampf den ans laufen zu bekommen.  Am Stück lief das Teil über 2 Monate bis gestern, als ich den 3.4.103 eingespielt habe.  Das Problem mit dem LogiMediaserver ist damit auch Geschichte. Ich hoffe das Ding läuft weiterhin wie geschmiert so weiter....

PS. Wie kann ich eigentlich die alten Kernel samt Anhang am effektivsten wieder loswerden.
Gruß aus Sachsen. FHEM auf Cubietruck. Vormals EZControl XS1 User.