Ein Modul zur Erfassen von diversen RPi/Linux-Statistiken (SYSMON)

Begonnen von hexenmeister, 06 Dezember 2013, 17:44:38

Vorheriges Thema - Nächstes Thema

Wernieman

#135
Das wäre sinnvoll.

Die GesammtCPU ist kein Sinnvoller Wert. Während eines Zeitraumes X hat die CPU immer Y Zeitschleifen, dieses "sollte" relativ konstant bleiben. Der Wert wird nur benötigt, um eine Prozentuale Belastung der CPU zu ermittelt.

Hinweis:
der Wert CPUidle giebt deshalb an, wie häufig die CPU eben NICHTS tat.

Mit solchen Werten habe ich schon div. Linux-Systeme bewerten können, vor allem eben, wo die Flaschenhälse liegen.

Edit:
Diese Werte zeigen übrigens, im Gegensatz zum "load-Wert", direkt die "Belastung" eines Systemes und geben deshalb Deinem SYSMON-Modul direkt die Möglichkeit eines Performance-Monitors.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Astrofreak85

so sieht da im übrigen in "MUNIN" aus (auch auf einem Raspi):

(http://markusfunke.eu/cpu.png)

Wernieman

Das System tu ja gar nichts ;o)
(O.K. 10% User Dauerlast ist auch nicht gerade wenig)
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Astrofreak85

tja hatte vorher ne "schlechte" SD-Karte drin, da sah das so aus:

(http://markusfunke.eu/cpu_bad.png)

Wernieman

Wie man an dem Beispiel eben gut sieht, ist die "Belastung des Systemes" ... und wenn man das gleich in FHEM erledigen kann (ohne Cacti o.Ä.) währe es für Fehlersuche durchaus "optimal" ;o)
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

hexenmeister

Die Werte auszurechnen wird nicht wirklich schwer sein.  Ich fürchte jedoch, solche Diagrammen (überenander gestapelte Flächen) kann FHEM (noch) nicht.

hexenmeister

So, habe die erste Version auf GitHub hochgeladen. Es werden Werte für GesamtCPU protokolliert, auf Systemen mit mehr als  einer CPU sollten zusätzlich noch Werte pro CPU sichtbar sein (kann ich bei mir leider nicht wirklich testen). Plots werde ich später nachreichen. Schaut euch bitte an, ob dies so sinnvoll ist oder noch verbessert werden kann.
Mit welchen Interval sollen die Werte am besten aktualisiert werden? Derzeit habe ich das fest auf 1 Minute gesetzt. Wäre das sinnvoll, dies ändern zu können?


Wernieman

Was ist für Dich GesamtCPU?

Du kannst auch alle "Normal" parallel in eine Linien-Diagramm aufzeigen.

Ideal währe bei "allen" Anzeigen eine Manuelle Einstellmöglichkeit der Pollingzeit. Wenn es aber nicht anders geht ... mach Dir kein Streß!
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

hexenmeister

damit meine ich die erste Zeile aus /proc/stat
Ich werde mich später an einem entsprechenden Diagramm versuchen. mal sehen, ob ich die Summierung in Plot hinbekomme, oder zusätzliche Readings erstellt werden müssen.
Einstellmöglichkeiten zu schaffen ist kein Problem. Die Frage ist, 'klemme' ich diese Aktualisierung zu einer der vier bereits vorhandenen Gruppen an (wo würde das thematisch hin passen?), oder muss eine neue erstellt werden?




Wernieman

- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

hexenmeister

#145
Habe drei Plot-Varianten zum Testen erstellt.
Irgendwie sind sie alle nicht ideal. Stellt man die Werte unabhängig von einander dar, ist das Ergebnis eher wenig übersichtlich.
Stellt man sie als Flächen übereinander (habe hier nur die Möglichkeit gefunden, die Werte aufzusummieren), sieht die Graphik zwar besser aus, aber die Werte (min, max etc.) sind natürlich falsch...

Zum Ausprobieren, hänhge ich hier die Dateien an.

Und die Definitionen dazu:

define wl_sysmon_cpustat SVG FileLog_sysmon:SM_CPUStat:CURRENT
attr wl_sysmon_cpustat room 9.99_Test
attr wl_sysmon_cpustat plotsize 800,300
define wl_sysmon_cpustat2 SVG FileLog_sysmon:SM_CPUStat2:CURRENT
attr wl_sysmon_cpustat2 room 9.99_Test
attr wl_sysmon_cpustat2 plotsize 800,300
define wl_sysmon_cpustatF SVG FileLog_sysmon:SM_CPUStatF:CURRENT
attr wl_sysmon_cpustatF room 9.99_Test
attr wl_sysmon_cpustatF plotsize 800,300


Grüße,

Alexander

Edit: der letzte Screenshot zeigt die Auslastungssituation während des nächtlichen Backups der SD-Karte.

Astrofreak85

 Nun ja, die "Live" Werte sollten ja immer 1 bzw. 100 ergeben, von daher passt eine Summierung doch...

hexenmeister

das schon, wenn man aber auf die Beschriftungen klickt, werden ja min/max-Werte angezeigt. Diese stimmen dann nicht mehr, da Summen.

Jetzt bleibt die Frage, ob und welche der Diagramme korrekt und sinnvoll sind?


Wernieman

ich Persönlich würde, solange kein echtes "Flächen übereinander" möglich ist.

Für einen Anfänger dürfte dagegen ein "Flächen übereinander" ersichtlicher sein.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

hexenmeister

Ich kann ja auch beides lassen.
für das erste diagramm: was ist besser, flächen oder linien?