Hallo,
ich habe einen Debian8 server und FHEM 5.8 sowie 2CUL
nach einiger Zeit (ca. 3 bis 4 Tage) kommt folgender Fehler in die Syslog
Feb 21 22:22:42 server kernel: [85774.349272] cdc_acm 1-2.1.4:1.0: failed to set dtr/rts
ein Neustart war bisher das einzige was den Fehler eliminierte.... (meines Wissens)
beim neustart wird es ja richtig gemeldet
Feb 21 22:25:51 server kernel: [ 4.584132] cdc_acm 1-2.1.1:1.0: ttyACM0: USB ACM device
Feb 21 22:25:51 server kernel: [ 4.584469] cdc_acm 1-2.1.4:1.0: ttyACM1: USB ACM device
Feb 21 22:25:51 server kernel: [ 4.584716] usbcore: registered new interface driver cdc_acm
Feb 21 22:25:51 server kernel: [ 4.584717] cdc_acm: USB Abstract Control Model driver for USB modems and ISDN adapters
Mir ist klar das der USB Treiber im kernel sich verabschiedet...aber Warum ?
Hardware Fehler ? ich finde keine detaillierte Informationen dazu..
Hat einer von euch denk anstösse ?
ISt es ein fest einkompilierter oder per Modul geladener Treiber?
Da ich es selber nicht habe, kann ich nicht gucken.
Ansonsten hättest DU fürs debugging die Möglichkeit, den das Modul zu entladen und wieder zu laden.
P.S. Durch den reboot wird natürlich auch die Hardware resettet, d.h. es kann auch diese sein ...
:o :o
jetzt fasse ich mich an den Kopf...
klar....
kann ja nur meine aktive USB Verlängerung sein..
Ich werde die mal austauschen.... ??? ??? .. Danke für den Hinweis das du den Treiber nicht hast..das hat mich drauf gebracht was das ist. ;)
Ich habe aber auch die Hardware nicht ;o)
Du kannst, wenn es funktioniert, mal gucken, was denn als Module geladen ist:
lsmod
bzw. einfach mal "als Schnellschuß":
lsmod | grep cdc
das sind die beiden CULs
ich geh davon aus das die Stromversorgung per USB schlappt macht...das könnte von der aktiven Verlängerung her kommen oder vom Motherboard...
als erstes habe ich "swatch" eingerichtet..und im logfile werde ich nun mal genaueres sehen können wann das immer vorkommt.
der Rechner startet sobald der Eintrag in der Syslog kommt erstmal neu..
ps:
ich hatte mal mit rmmode und insmode probiert....da fällt beim rmmode erstmal alles zusammen (crash)..
da blieb nur die option "reboot" über swatch
Besser ist modprobe ..
"modprobe -r" und "modprobe" ... und das bitte nur auf das Passende Modul
Edit:
Ein Automatischer Reboot ohne nach dem Fehler zu suchen ist bei einem Unix-Sytem wirklich ... heftig .....
okay...danke für den tipp
ich habe im script folgendes zum testen
service fhem stop
modprobe -r cdc_acm --force
modprobe cdc_acm
service fhem start
werde mal sehen ob das beim nächsten fehler hilft.
Bist Du Dir bei dem Modulnamen sicher?
Prüfe am besten auch, welche module sich auf dieses beziehen, findest Du auch in der lsmod anzeige ...
die meldung in der Syslog
Feb 21 22:22:42 server kernel: [85774.349272] cdc_acm 1-2.1.4:1.0: failed to set dtr/rts
lsmod
Module Size Used by
cdc_acm 30362 4
xt_geoip 12558 24
xt_multiport 12518 8
ip6table_filter 12540 1
ip6_tables 25820 1 ip6table_filter
iptable_filter 12536 1
ip_tables 21711 1 iptable_filter
x_tables 27399 6 ip6table_filter,ip_tables,xt_geoip,xt_multiport,iptable_filter,ip6_tables
pci_stub 12429 1
vboxpci 23077 0
vboxnetadp 25443 0
vboxnetflt 27598 0
vboxdrv 344446 3 vboxnetadp,vboxnetflt,vboxpci
nfsd 262938 13
auth_rpcgss 51209 1 nfsd
oid_registry 12419 1 auth_rpcgss
nfs_acl 12511 1 nfsd
nfs 192232 0
lockd 83389 2 nfs,nfsd
fscache 45542 1 nfs
sunrpc 237364 19 nfs,nfsd,auth_rpcgss,lockd,nfs_acl
quota_v2 12959 2
quota_tree 17002 1 quota_v2
kvm_amd 59128 0
kvm 392897 1 kvm_amd
edac_mce_amd 21166 0
evdev 17445 5
edac_core 47321 0
pcspkr 12595 0
serio_raw 12849 0
k10temp 12618 0
sp5100_tco 12864 0
i2c_piix4 20864 0
radeon 1349406 1
ttm 77862 1 radeon
drm_kms_helper 49210 1 radeon
drm 249998 4 ttm,drm_kms_helper,radeon
i2c_algo_bit 12751 1 radeon
i2c_core 46012 5 drm,i2c_piix4,drm_kms_helper,i2c_algo_bit,radeon
shpchp 31121 0
acpi_cpufreq 17218 0
processor 28221 1 acpi_cpufreq
button 12944 0
thermal_sys 27642 1 processor
parport_pc 26300 0
ppdev 16782 0
lp 17074 0
parport 35749 3 lp,ppdev,parport_pc
autofs4 35529 2
ext4 477894 3
crc16 12343 1 ext4
mbcache 17171 1 ext4
jbd2 82514 1 ext4
sg 29973 0
sd_mod 44356 7
crc_t10dif 12431 1 sd_mod
crct10dif_generic 12581 1
crct10dif_common 12356 2 crct10dif_generic,crc_t10dif
ata_generic 12490 0
psmouse 99249 0
pata_atiixp 12747 0
e1000e 212128 0
ptp 17692 1 e1000e
pps_core 17225 1 ptp
ohci_pci 12808 0
ahci 33334 5
libahci 27158 1 ahci
ehci_pci 12512 0
ohci_hcd 42982 1 ohci_pci
ehci_hcd 69837 1 ehci_pci
libata 177508 4 ahci,libahci,ata_generic,pata_atiixp
scsi_mod 191405 3 sg,libata,sd_mod
usbcore 195468 5 ohci_hcd,ohci_pci,ehci_hcd,ehci_pci,cdc_acm
usb_common 12440 1 usbcore
eigentlich sollte das cdc_acm sein
und ich habe nur die beiden CULs am USB..
Hiwneis:
Solche Blöcke sind besser durch "code-Tags", lesbar findest Du im Editor unter dem "#"
Das Modul wird laut lsmod 4 Mal verwendet, aber nicht von anderen Modulen (wenn ich jetzt nichts überlesen habe). Also sollte folgendes funktionieren:
modprobe -r cdc_acm
lsmod | grep cdc_acm
dmesg | tail
modprobe -r cdc_acm
lsmod | grep cdc_acm
dmesg | tail
Bei dmesg | tail soltest Du versuchen zu verstehen, was dort steht. Wenn modprobe einen Fehler wirft, brauchst Du auch nicht weitermachen ..... dann müssten wir tiefer einsteigen.
Hinweis:
Alle Angaben ungeprüft und deshalb ohne gewähr
danke für den Hinweis...
modprobe -r cdc_acm
modprobe: FATAL: Module cdc_acm is in use.
erst wenn ich fhem beende ..klappts
daher
servie fhem stop
ob das später hilft wird sich zeigen
swatch überwacht jetzt die syslog nach
cdc_acm 1-2.1.4:1.0: failed to set
und
cdc_acm 1-2.1.2:1.0: failed to set
das sind die beiden Culs...wenn die Meldung im syslog auftaucht...wird das script gestartet und mir eine benachrichtung hinterlassen.
das syslog wird dann durch eine leere Datei ersetz.
echo `/bin/date` "$line" >> /var/log/server_start.log ;
echo " swatch hat Fehler gefunden und starte den Treiber neu" >> /var/log/server_start.log ;
cp --backup=numbered /var/log/syslog /var/log/syslog.bak
sleep 5
rm -f /var/log/syslog
###### test
service fhem stop ;
modprobe -r cdc_acm --force ;
modprobe cdc_acm ;
service fhem start ;
########
cp /opt/script/syslog /var/log/
# /sbin/shutdown -r +2 "Server wird in 2 Minuten herunter gefahren. Bitte beenden Sie alle aktivitäten" ;
exit ;
hier mal das komplette script welches durch swatch an geschubst wird. swatch im cronjob alle 5min.
brauchst Du wirklich "--force"?
Würde es, zum debuggen, wirklich erstmal per Hand ausprobieren ....
--force könnte ich weg lassen....
klar hab ich mein script per Hand vorher probiert...
aber ob es den Fehler später beseitigt...stellt sich noch raus
Du könntest auch das, was ich oben geschrieben habe, in eine Textdatei umleiten ..... währe fürs Debugging optimaler!
stand heute... Fehler trat wieder auf...
script wurde gestartet ...
Feb 23 16:47:55 server systemd[1]: Stopping LSB: FHEM server...
Feb 23 16:47:55 server fhem[5853]: Stopping fhem...
Feb 23 16:47:55 server systemd[1]: Stopped LSB: FHEM server.
Feb 23 16:47:58 server kernel: [66567.652434] usbcore: deregistering interface driver cdc_acm
Feb 23 16:47:58 server kernel: [66567.673566] cdc_acm 1-2.1.2:1.0: ttyACM0: USB ACM device
Feb 23 16:47:58 server kernel: [66567.675477] cdc_acm 1-2.1.4:1.0: ttyACM1: USB ACM device
Feb 23 16:47:58 server kernel: [66567.676688] usbcore: registered new interface driver cdc_acm
Feb 23 16:47:58 server kernel: [66567.676697] cdc_acm: USB Abstract Control Model driver for USB modems and ISDN adapters
Feb 23 16:47:59 server systemd[1]: Starting LSB: FHEM server...
Feb 23 16:47:59 server fhem[5902]: Starting fhem...
Feb 23 16:47:59 server systemd[1]: Started LSB: FHEM server.
Feb 23 16:49:05 server systemd[1]: getty@tty1.service has no holdoff time, scheduling restart.
Feb 23 16:49:05 server systemd[1]: Stopping Getty on tty1...
Feb 23 16:49:05 server systemd[1]: Starting Getty on tty1...
Feb 23 16:49:05 server systemd[1]: Started Getty on tty1.
alles funktioniert scheinbar ...ohne "reboot"..
;D ;D
Ich danke dir für deine Hilfe und Anregungen...
zum schluss das fertige script
#########################################################################
## ! Script : wird von "swatch" aus gestartet
## : es wird eine Nachricht in einer Logdatei geschrieben
## : Die Syslog wird als *.bak kopiert und danach geleert
## : Hardware wird versucht neu zu starten
##
## deaktiviert : neustart
#########################################################################
#############
## -- logen
#############
echo `/bin/date` "$line" > /var/log/info.log ;
echo " swatch hat Fehler gefunden und starte den Treiber neu" >> /var/log/info.log ;
#############
## -- sichern
#############
cp --backup=numbered /var/log/syslog /var/log/syslog.bak ;
sleep 5 ;
service rsyslog stop
rm -f /var/log/syslog ;
cp /opt/script/syslog /var/log/
service rsyslog start
#############
## Hardware neu starten
#############
lsmod | grep cdc_acm >> /var/log/info.log ;
service fhem stop ;
sleep 3 ;
modprobe -r cdc_acm --force ;
lsmod | grep cdc_acm >> /var/log/info.log ;
dmesg | tail >> /var/log/info.log ;
modprobe cdc_acm ;
lsmod | grep cdcd_acm >> /var/log/info.log ;
dmesg | tail >> /var/log/info.log ;
service fhem start ;
exit ;
Und was steht im "/var/log/info.log"?
nichts bewegendes...
Do 23. Feb 16:47:50 CET 2017
swatch hat Fehler gefunden und starte den Treiber neu
cdc_acm 30362 4
usbcore 195468 5 ohci_hcd,ohci_pci,ehci_hcd,ehci_pci,cdc_acm
[38038.863651] usb 1-2.1.4: Product: CUL433
[38038.863657] usb 1-2.1.4: Manufacturer: busware.de
[38038.864441] cdc_acm 1-2.1.4:1.0: ttyACM1: USB ACM device
[66567.652434] usbcore: deregistering interface driver cdc_acm
[66567.673566] cdc_acm 1-2.1.2:1.0: ttyACM0: USB ACM device
[66567.675477] cdc_acm 1-2.1.4:1.0: ttyACM1: USB ACM device
[66567.676688] usbcore: registered new interface driver cdc_acm
[66567.676697] cdc_acm: USB Abstract Control Model driver for USB modems and ISDN adapters
"dmesg | tail " bringt Dir nur so wenig Zeilen??
ja...aktuell wäre das jetzt
root@server:/home/holger# dmesg | tail
[67562.968178] vboxnetflt: 0 out of 3490 packets were not sent (directed to host)
[68157.396132] nfsd: last server has exited, flushing export cache
[68157.447494] NFSD: Using /var/lib/nfs/v4recovery as the NFSv4 state recovery directory
[68157.447537] NFSD: starting 90-second grace period (net ffffffff818ba340)
[88416.776209] php-cgi[21482]: segfault at 58ae91f8 ip 000000000070a2cd sp 00007fff4f0e9c60 error 4 in php5-cgi[400000+7ef000]
[88533.829434] php-cgi[21561]: segfault at 58ae91f8 ip 000000000070a2cd sp 00007ffd4aceb0d0 error 4 in php5-cgi[400000+7ef000]
[88539.308736] php-cgi[21562]: segfault at 58ae91f8 ip 000000000070a2cd sp 00007ffd1b327020 error 4 in php5-cgi[400000+7ef000]
[88543.365077] php-cgi[21565]: segfault at 58ae91f8 ip 000000000070a2cd sp 00007ffc2c011c30 error 4 in php5-cgi[400000+7ef000]
[88677.907125] php-cgi[21563]: segfault at 58ae91f8 ip 000000000070a2cd sp 00007ffcf51cfd40 error 4 in php5-cgi[400000+7ef000]
[103084.747543] perf interrupt took too long (2504 > 2500), lowering kernel.perf_event_max_sample_rate to 50000