Autofs hängt sich auf, nachdem Mountpoint nicht mehr verfügbar ist

Begonnen von Bartimaus, 20 Dezember 2021, 18:00:52

Vorheriges Thema - Nächstes Thema

Bartimaus

Hallo Zusammen,

ich hoffe ich bin hier richtig mit meiner Frage.

Ich habe mehrere LinuxServer (Qnap,Raspi4,BananaPi) in Betrieb.

Für einen übergreifenden Zugriff habe ich AutoFS installiert und konfiguriert.

2 der Server laufen 24/7 (FHEM-Server+ PiHoleServer).
BananaPi und QNAP laufen nur temporär.

Starte ich den BananaPi, wird er vom PiHole-Server per Autofs automatisch via NFS gemontet und ich kann auf die freigegebenen Verzeichnisse des BPi zugreifen.
Wird der BPI jedoch heruntergefahren, hängt sich AutoFS am PiHole dermassen auf, so das nu ein Neustart des PiHole hilft.

Starten/mounten + herunterfahren/Unmounten z.B. des QNAPs bereitet dem PiHole keine Probleme.

Die Mounts sind identisch mit den gleichen Optionen konfiguriert.

Hat jemand ne Idee was hier schiefläuft, bzw. wo ich nach dem Fehler suchen muss ?

Hier ein Auszug der messages.log auf dem PiHole

Dec 20 16:17:48 RPI4-DNS-UNIFI kernel: [21288.320352] nfs: server 192.168.xxx.5 not responding, timed out
Dec 20 16:17:56 RPI4-DNS-UNIFI kernel: [21295.360407] nfs: server 192.168.xxx.5 not responding, timed out
Dec 20 16:18:04 RPI4-DNS-UNIFI kernel: [21304.320507] nfs: server 192.168.xxx.5 not responding, timed out


hier die Map-Datei auf dem PiHole-Server


QnapBackup -fstype=nfs,rw,retry=0 192.168.XXX.6:/share/Backup/
Rpi4FHEM -fstype=nfs,rw,retry=0 192.168.xxx.7:/media/
BPiMedia -fstype=nfs,retry=0 192.168.241.5:/media/

LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

Mir fallen da ein paar Fragen ein ...
- Weißt Du, mit welcher Version von NFS Du mountest?
- Wohin mountest Du? Also der Mountpoint
- Hat auf dem Mountpoint eine Software dauerhaft Zugriff?
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

Hallo Werniemann,

danke für Deine Rückmeldung... hatte mir schon gedacht das Du als LinuxProfi Dich meldest  ;D

Berechtigte Fragen,

- Versionsnummern weiss ich ad hoc nicht, aber ich halte die Systeme durch wöchentliche Updates aktuell, schaue ich aber noch nach
- Mountpoint ist auf dem jeweiligen Device immer: /mnt/"gemountetes Device" aka BPi/QNAP/RPiFHEM
- Ja, auf dem Linux wo sich das AutoFS aufhängt, greift der installierte PlexServer auf die gemounteten Geräte zu. Hatte dies auch im Verdacht, habe dann das "automatische Aktualisieren bei Plex" ausgeschaltet. Problem trat danach immer noch auf. Auf das QNAP greift der PlexServer auch zu, da trat das Problem aber nicht auf.


Als Workarount mounte ich jetzt den BPi vom Plex/DNS/PiHole/Raspi via CIFS und nicht mehr NFS, das scheint bis jetzt zu helfen.
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

#3
Die QNAP dürfte ein älteres NFS fahren als ein "normales" Linux. Kann es aktuell nicht überprüfen und Dir damit auch nicht sagen, wie man die Versionnummer, welche verwendet wird, überprüfen kann. Laut google solltest Du es finden mit:
nfsstat -c
nfsstat -m
Könntest Du mir den Output der Befehle geben? (Hinweis: Bitte als root)

Du könntest auch mit "nfsvers=3" im mont-Befehl es Konfigurieren. Auch ein Async-Betrieb mit "async" ist sinnvoll
Siehe u.A.: https://wiki.ubuntuusers.de/NFS/, https://docs.oracle.com/cd/E19253-01/816-4555/rfsrefer-18/index.html

Edit
Typo korrigiert + Ergänzungen zum mount + Doku-Links
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Bartimaus

#5
Büdde:

sudo nfsstat -c
Client rpc stats:
calls      retrans    authrefrsh
212185     0          212187

Client nfs v3:
null             getattr          setattr          lookup           access
5         0%     1550      0%     0         0%     105       0%     224       0%
readlink         read             write            create           mkdir
104       0%     197398   98%     0         0%     0         0%     0         0%
symlink          mknod            remove           rmdir            rename
0         0%     0         0%     0         0%     0         0%     0         0%
link             readdir          readdirplus      fsstat           fsinfo
0         0%     0         0%     30        0%     8         0%     62        0%
pathconf         commit
31        0%     0         0%

Client nfs v4:
null             read             write            commit           open
97        0%     7256     57%     0         0%     0         0%     0         0%
open_conf        open_noat        open_dgrd        close            setattr
0         0%     556       4%     0         0%     556       4%     0         0%
fsinfo           renew            setclntid        confirm          lock
13        0%     0         0%     0         0%     0         0%     0         0%
lockt            locku            access           getattr          lookup
0         0%     0         0%     946       7%     2527     19%     10        0%
lookup_root      remove           rename           link             symlink
4         0%     2         0%     0         0%     0         0%     0         0%
create           pathconf         statfs           readlink         readdir
0         0%     9         0%     42        0%     1         0%     28        0%
server_caps      delegreturn      getacl           setacl           fs_locations
22        0%     556       4%     0         0%     0         0%     0         0%
rel_lkowner      secinfo          fsid_present     exchange_id      create_session
0         0%     0         0%     0         0%     8         0%     4         0%
destroy_session  sequence         get_lease_time   reclaim_comp     layoutget
3         0%     19        0%     0         0%     4         0%     0         0%
getdevinfo       layoutcommit     layoutreturn     secinfo_no       test_stateid
0         0%     0         0%     0         0%     4         0%     0         0%
free_stateid     getdevicelist    bind_conn_to_ses destroy_clientid seek
0         0%     0         0%     0         0%     3         0%     0         0%
allocate         deallocate       layoutstats      clone
0         0%     0         0%     0         0%     0         0%


Die weiteren Mountoptionen teste ich morgen mal


LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Bartimaus

Hatte gestern Abend noch etwas mit den Einstellungen gespielt, aber nicht gespeichert oder AutoFS neu gestartet. However, heute morgen hing AutoFS wieder fest.

Dec 22 02:30:09 RPI4-DNS-UNIFI automount[10466]: attempting to mount entry /mnt/BPiMedia
Dec 22 02:30:09 RPI4-DNS-UNIFI kernel: [115195.332112] CIFS: Attempting to mount //192.168.xxx.5/media/1TBHDD/
Dec 22 02:30:15 RPI4-DNS-UNIFI automount[10466]: >> Unable to find suitable address.
Dec 22 02:30:15 RPI4-DNS-UNIFI automount[10466]: mount(generic): failed to mount //192.168.xxx.5/media/1TBHDD/ (type cifs) on /mnt/BPiMedia
Dec 22 02:30:15 RPI4-DNS-UNIFI automount[10466]: failed to mount /mnt/BPiMedia
Dec 22 02:30:15 RPI4-DNS-UNIFI kernel: [115201.606171] CIFS: VFS: Error connecting to socket. Aborting operation.
Dec 22 02:30:15 RPI4-DNS-UNIFI kernel: [115201.606192] CIFS: VFS: cifs_mount failed w/return code = -113
Dec 22 02:30:15 RPI4-DNS-UNIFI automount[10466]: expiring path /mnt/Qnap
Dec 22 02:30:27 RPI4-DNS-UNIFI automount[10466]: could not umount dir /mnt/QnapBackup
Dec 22 02:30:27 RPI4-DNS-UNIFI automount[10466]: couldn't complete expire of /mnt/QnapBackup
Dec 22 02:30:27 RPI4-DNS-UNIFI automount[10466]: expiring path /mnt/QnapMedianF


Habe jetzt gem. https://support.hpe.com/hpesc/public/docDisplay?docLocale=en_US&docId=emr_na-c02768231 den BrowseMode und NFSVERS=3 in der Autofs.conf aktiviert. Gleichzeitig habe ich auch Deinen Tip befolgt und "async" in den Mountoptionen hinzugefügt. Es bleibt spannend.

Ach ja, und das Logging habe ich jetzt mal auf "debug" gesetzt.
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

Aktuell benutzt DU also beide Versionen. Habe mit nfs V4 noch nicht sooo viel rumgespielt, aber kannst mal mit verschiedenen Versionen rumprobieren.

SMB ist zwar auch eine Lösung, hat nur mehr Overhead als nfs, dafür natürlich auch mehr Sicherheit
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Wernieman

Du hast geantwortet, während ich geschrieben habe.

Eine Frage am Rande: Wie ist Dein Pi angebunden? WLAN oder Kabel?

CIFS scheint bei Dir Netzwerkprobleme zu haben
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

Hi, obwohl ich ja NFSVERS=3 aktiviert habe, bekomme ich via "sudo nfsstat -c" immer noch das gleiche Ergebnis wie oben.

Hm, finde nix zu dem "Returncode -113" bei CIFS. Hast Du da was gefunden ?

Habe alle Server per LAN angebunden. Allerdings bringst mich da auf etwas.... der RPi4-Pihole hängt an einer Dual-Netzwerkdose via Patchkabel. Obwohl dort lt. Netzwerktester alles ok ist, klagt mein Sohn mit seiner PS5 auch über ab und an von Aussetzern an dieser Dose........, hm..... vielleicht nochmal neu auflegen ?


LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

Kannst mal gucken, welche "error"-Anzahl die Netzwerkkarte wirft (ifconfig). Sollte normalerweise um die 0 sein, wenn die Kiste nicht schon Jahre läuft.

Für die Kurzfassung (als root)
ifconfig | grep errors
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

Bartimaus

So, komme gerade vom Dachboden wo ich das Patchpanel mit allen 6 Leitungen sauber neu aufgelegt habe. Incl. Erdung und korrekter Zugentlastung.
JETZT meldet der Tester auch ein "grün" bei "G".

Hier das gewünschte Ergebnis. Wird aber erst interessant, wenn ich das in 24 oder 48h neu gecheckt habe.

sudo ifconfig | grep errors
        RX errors 0  dropped 0  overruns 0  frame 0
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
        RX errors 0  dropped 0  overruns 0  frame 0
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0


Das sieht ja schonmal gut aus. Die Spannung bleibt, und der BPi ist jetzt wieder per NFS gemountet.
LG
B.


FHEM@Intel-J4105@Debian-LXC, CUL1101,FS20,IT,DS18B20,DS2413(Heizungslogger),DS2423(Stromlogger)Homematic,HM-LAN,ZWave,MiniCULs,Shelly

Wernieman

Also doch eher Netzwerkproblem. Womit hast Du das Kabel geprüft, weil Du "grün" schriebst?
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html


Wernieman

O.K. .. reiner "Durchgansprüfer"

Verstehe mich nicht falsch: Das ist schon mal ein Anfang und mehr, als ich habe. Aber ein "richtiger" Tester kann/sollte mehr. Trotzdem gut um solche Fehler zu finden.
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html