FHEM hängt im SYSMON Modul

Begonnen von erwin, 22 Januar 2015, 12:54:49

Vorheriges Thema - Nächstes Thema

erwin

Hi,
ich habe seit kurzem das Phänomen, das mein FHEM (auf RPI) nach ein Paar Stunden (oder auch Tagen) einfach hängt.
Ursache scheint folgendes zu sein:
fhem     10318  2098  0 10:26 ?        00:00:00 cat /sys/class/thermal/thermal_zone0/temp
Wenn ich den command auf der ssh-Konsole eingebe, hängt die Konsole, Problem ist also wiederholbar.
In dieser Situation lässt sich der process nicht killen und fhem sich nicht stoppen.
Reboot geht auch nicht mehr, es hilft nur stecker ziehen..... nicht sehr elegant....
/var/log/messages leifert folgendes:
Jan 22 08:44:42 MH-RPI-1 kernel: [   32.969850] Adding 102396k swap on /var/swap.  Priority:-1 extents:1 across:102396k SSFS
Jan 22 09:18:18 MH-RPI-1 kernel: [ 1825.973180] bcm2708_fb_blank(1) returns=1 p[1]=0x80000000
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438408] cat             D c04428dc     0 10318   2098 0x00000000
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438482] [<c04428dc>] (__schedule+0x2a0/0x5ac) from [<c0440dcc>] (schedule_timeout+0x18c/0x21c)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438545] [<c0440dcc>] (schedule_timeout+0x18c/0x21c) from [<c0442304>] (__down+0x7c/0xb8)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438587] [<c0442304>] (__down+0x7c/0xb8) from [<c0040dd4>] (down+0x80/0x84)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438622] [<c0040dd4>] (down+0x80/0x84) from [<c001b540>] (dev_mbox_read+0x48/0x74)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438732] [<c001b540>] (dev_mbox_read+0x48/0x74) from [<c001b6a0>] (bcm_mailbox_property+0xa0/0x194)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438804] [<c001b6a0>] (bcm_mailbox_property+0xa0/0x194) from [<c03365c4>] (bcm2835_get_temp_or_max.isra.0+0x50/0xc0)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438837] [<c03365c4>] (bcm2835_get_temp_or_max.isra.0+0x50/0xc0) from [<c0333f14>] (thermal_zone_get_temp+0x38/0x54)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438863] [<c0333f14>] (thermal_zone_get_temp+0x38/0x54) from [<c033408c>] (temp_show+0x18/0x3c)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438900] [<c033408c>] (temp_show+0x18/0x3c) from [<c02a3058>] (dev_attr_show+0x1c/0x48)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438944] [<c02a3058>] (dev_attr_show+0x1c/0x48) from [<c014bbc0>] (sysfs_read_file+0x90/0x134)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.438986] [<c014bbc0>] (sysfs_read_file+0x90/0x134) from [<c00e57a0>] (vfs_read+0x98/0x170)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.439014] [<c00e57a0>] (vfs_read+0x98/0x170) from [<c00e5f74>] (SyS_read+0x3c/0x78)
Jan 22 10:29:53 MH-RPI-1 kernel: [ 6121.439048] [<c00e5f74>] (SyS_read+0x3c/0x78) from [<c000dec0>] (ret_fast_syscall+0x0/0x30)

in diesem Fall also ca. 1:45 Stunden nach Systemstart....
hab auch ins SYSSTAT  modul geschaut, da wird der selbe command verwendet - sollte also auch betroffen sein.
Übrigens: so ein Problem gabs schon einmal, siehe: http://forum.fhem.de/index.php/topic,21715.msg152243.html#msg152243

Any ideas ?
l.g. erwin
FHEM aktuell auf RaspberryPI Mdl 1-4
Maintainer: 00_KNXIO.pm 10_KNX.pm
User: CUNO2 (868 SLOWRF) - HMS100xx, FS20, FHT, 1-Wire  - 2401(iButton), 18x20, 2406, 2413 (AVR), 2450,..,MQTT2, KNX, SONOFF, mySENSORS,....
Hardware:  Busware ROT, Weinzierl IP731, 1-Wire GW,...

smurfix

Gratuliere, du hast einen Kernel-Bug gefunden.

Ein Reboot sollte mit "sync & sleep 1; /sbin/reboot -f" trotzdem funktionieren.

erwin

Hi smurfix,

danke für die tröstenden Worte  ;)   Der reboot hat nicht funktioniert, den SSH- deamon hat er noch gekillt, pingen hat sich das ding aber noch immer lassen....
Also: wieder Stecker raus....
Wenigstens was gelernt: wie man eine dirty boot partition repariert...
l.g. und danke erwin
FHEM aktuell auf RaspberryPI Mdl 1-4
Maintainer: 00_KNXIO.pm 10_KNX.pm
User: CUNO2 (868 SLOWRF) - HMS100xx, FS20, FHT, 1-Wire  - 2401(iButton), 18x20, 2406, 2413 (AVR), 2450,..,MQTT2, KNX, SONOFF, mySENSORS,....
Hardware:  Busware ROT, Weinzierl IP731, 1-Wire GW,...