Mein FHEM ist tot - wie gehe ich vor?

Begonnen von FHEMAN, 13 April 2016, 11:29:50

Vorheriges Thema - Nächstes Thema

FHEMAN

Hallo zusammen,

gestern Abend war noch alles wunderbar. Heute Nacht bekam ich 3 merkwürdige Neustarts per Mail übermittelt. Und heute früh hat mein Haus jeden Komfort verloren.
Was kann ich nun tun, außer:


  • Anpingen [funktioniert]
  • Telnet SSH [funktioniert]
  • Start automatisch [funktioniert scheinbar, da ein weiterer Start via "perl fhem.pl fhem.cfg" mit Port 7072 already in use im Log quittiert wird]
  • Log
2016.04.13 08:04:12 1: Including fhem.cfg
2016.04.13 08:04:12 3: telnetPort: port 7072 opened
2016.04.13 08:04:13 3: WEB: port 8083 opened
2016.04.13 08:04:15 2: eventTypes: loaded 5637 events from ./log/eventTypes.txt
2016.04.13 08:04:16 3: Opening CUL0 device /dev/ttyACM0
2016.04.13 08:04:16 3: Setting CUL0 serial parameters to 9600,8,N,1
2016.04.13 08:04:16 3: CUL0 device opened
2016.04.13 08:04:16 3: CUL0: Possible commands: BbCFiAZEGMKUYRTVWXefmltux
2016.04.13 08:04:16 2: Switched CUL0 rfmode to HomeMatic
2016.04.13 08:05:00 3: FHEM2FHEM opening Fritzremote at 192.168.2.1:7072
2016.04.13 08:05:00 3: Can't connect to 192.168.2.1:7072: Connection refused
2016.04.13 08:05:00 3: Opening Fritzbox_Callmonitor device 192.168.2.1:1012
2016.04.13 08:05:00 3: Fritzbox_Callmonitor device opened
2016.04.13 08:05:02 3: RoombaStat: Defined with URL http://192.168.2.110/roomba.xml and interval 180
2016.04.13 08:05:02 3: RoombaStat: the attribute readingsName2 should no longer be used. Please use reading01Name syntax instead
2016.04.13 08:05:02 3: RoombaStat: For most old attributes you can specify enableControlSet and then set device upgradeAttributes to automatically modify the configuration
2016.04.13 08:05:02 3: RoombaStat: the attribute readingsName3 should no longer be used. Please use reading01Name syntax instead
2016.04.13 08:05:02 3: RoombaStat: For most old attributes you can specify enableControlSet and then set device upgradeAttributes to automatically modify the configuration
2016.04.13 08:05:02 3: RoombaStat: the attribute readingsName4 should no longer be used. Please use reading01Name syntax instead
2016.04.13 08:05:02 3: RoombaStat: For most old attributes you can specify enableControlSet and then set device upgradeAttributes to automatically modify the configuration
2016.04.13 08:05:02 3: RoombaStat: the attribute readingsRegex2 should no longer be used. Please use reading01Regex syntax instead
2016.04.13 08:05:02 3: RoombaStat: For most old attributes you can specify enableControlSet and then set device upgradeAttributes to automatically modify the configuration
2016.04.13 08:05:02 3: RoombaStat: the attribute readingsRegex3 should no longer be used. Please use reading01Regex syntax instead
2016.04.13 08:05:02 3: RoombaStat: For most old attributes you can specify enableControlSet and then set device upgradeAttributes to automatically modify the configuration
2016.04.13 08:05:02 3: RoombaStat: the attribute readingsRegex4 should no longer be used. Please use reading01Regex syntax instead
2016.04.13 08:05:02 3: RoombaStat: For most old attributes you can specify enableControlSet and then set device upgradeAttributes to automatically modify the configuration
2016.04.13 08:05:05 1: Including ./log/fhem.save
2016.04.13 08:05:07 3: Device ... added to ActionDetector with 000:10 time
...
2016.04.13 08:05:10 3: Device ... added to ActionDetector with 000:10 time
2016.04.13 08:05:10 1: FHEM global: System INITIALIZED
2016.04.13 08:40:35 1: Including fhem.cfg
2016.04.13 08:40:35 1: telnetPort: Can't open server port at 7072: Address already in use. Exiting.


Wo setze ich jetzt am besten an?

Seit gestern haben wir massive Probleme mit dem Internet. Kann das damit zusammenhängen?

Gruß
Ronny
NUC7i5 | PROXMOX | FHEM 6.2 | 1 HMLAND | 2 UART | HM | LMS | HIFIBERRY | DOORBIRD | BLINK | BUDERUS | HUE | ALEXA | MILIGHT | LUFTDATENINFO | MQTT| ZIGBEE2MQTT | INDEGO | ROBOROCK | SMA | APC | OPENWB

franky08

Was passiert nach einem kompletten reboot des Systems? Auf was für einer Plattform läuft dein fhem?

VG
Frank
Debian Bookworm auf HUNSN / Debian Bullseye auf 2.ter HUNSN F2F an 2x RaspiB
mit FHEM aktuell
22Zoll ViewSonic als Infodislay (WVC)
3xHMLAN mit vccu, raspmatic_rpi3, HMIP-HCU1

Rince

ZitatSeit gestern haben wir massive Probleme mit dem Internet. Kann das damit zusammenhängen?

Ja.

Kann es durchaus. Wenn du irgendwelche Module einsetzt, die durch Pings oder Abfragen Daten aus dem Internet ziehen, und bei einer nicht-Antwort fhem blockieren.

Schwierig wird imho rauszufinden, welches Modul hier bockt.

Mach erst mal auf deiner Linux-Konsole ein "top"

Das zeigt die an welche Prozesse laufen und wie viel CPU-Last sie ziehen.

Wenn da oben ein Prozess "Perl" mit nahezu 100% CPU-Last steht, würde ich da anfangen zu suchen...


PS:
Off topic:
Was auch lustig ist: wenn man seinen fhem Rechner auf DHCP gestellt hat, und der Strom ausfällt...
Wenn er wieder kommt, kann er durchaus schneller sein als der DHCP-Server im Netz (Fritte) => dann gibt er sich eine eigene. Er läuft zwar, aber in einem völlig falschen Netz.
Wer zu meinen Posts eine Frage schreibt und auf eine Antwort wartet, ist hiermit herzlich eingeladen mich per PN darauf aufmerksam zu machen. (Bitte mit Link zum betreffenden Thread)

VB90

Ich würde versuchen, fhem über die Konsole per Hand zu stoppen und starten.
Wenn das fehlschlägt, bekommst du eine entsprechende Meldung.

Wenn du gestern irgendwelche Änderungen vorgenommen hast, würde ich diese händisch über die .cfg auskommentieren und somit deaktivieren.
Eventuell erneuerte Module wieder auf den alten Stand bringen.

Logfiles sichern und sichten. Vielleicht ist im Log von heute Nacht mehr zu erkennen.

Wenn das alles nichts bringt, mit einer "Nackten" fhem.cfg starten, um sicherzustellen, das das System ansich läuft und einzugrenzen ob es ein Config-Problem deines FHEM ist.

vb
Man muss das Rad nicht neu erfinden, nur wissen wie es gedreht wird.

CoolTux

Und einfach mal alles abziehen was so an CUL's oder anderen USB Stickgeraffel dran hängt. Alternativ die automatische USB erkennung aus dem global Bereich auskommentieren.
Du musst nicht wissen wie es geht! Du musst nur wissen wo es steht, wie es geht.
Support me to buy new test hardware for development: https://www.paypal.com/paypalme/MOldenburg
My FHEM Git: https://git.cooltux.net/FHEM/
Das TuxNet Wiki:
https://www.cooltux.net

FHEMAN

OK, ihr macht mir Hoffnung :)

ZitatWas passiert nach einem kompletten reboot des Systems?
Nichts auffälliges. Bzw. worauf zielt Deine Frage ab? Anscheinend wird fhem.pl gestartet, die Weboberfläche bzw. FHEM allgemein sind nicht erreichbar.

ZitatMach erst mal auf deiner Linux-Konsole ein "top"
Nix auffälliges, max. 2% CPU Load von Squeezelite:
top - 12:41:42 up  4:37,  1 user,  load average: 0.19, 0.07, 0.06
Tasks:  83 total,   1 running,  82 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.7 us,  0.7 sy,  0.0 ni, 97.6 id,  0.0 wa,  0.0 hi,  1.1 si,  0.0 st
KiB Mem:   2046904 total,   299704 used,  1747200 free,    20272 buffers
KiB Swap:        0 total,        0 used,        0 free,   203676 cached

  PID USER      PR  NI  VIRT  RES  SHR S  %CPU %MEM    TIME+  COMMAND
2499 root      20   0 10492 9032 2764 S   1.3  0.4   4:12.74 squeezelite-arm
3166 derron    20   0  6136 1188  856 R   1.0  0.1   0:01.31 top
   62 root      rt   0     0    0    0 S   0.3  0.0   0:00.97 cfinteractive
  646 root      -2   0     0    0    0 S   0.3  0.0   0:09.27 dhd_dpc
3119 derron    20   0  8548 1416  832 S   0.3  0.1   0:00.08 sshd
3170 root      20   0     0    0    0 S   0.3  0.0   0:00.02 kworker/0:0
    1 root      20   0  1756  624  524 S   0.0  0.0   0:02.78 init
    2 root      20   0     0    0    0 S   0.0  0.0   0:00.01 kthreadd
    3 root      20   0     0    0    0 S   0.0  0.0   0:00.64 ksoftirqd/0
    5 root      20   0     0    0    0 S   0.0  0.0   0:00.00 kworker/u:0
    6 root      rt   0     0    0    0 S   0.0  0.0   0:00.01 migration/0
    7 root      rt   0     0    0    0 S   0.0  0.0   0:00.01 migration/1
    8 root      20   0     0    0    0 S   0.0  0.0   0:01.13 kworker/1:0
    9 root      20   0     0    0    0 S   0.0  0.0   0:00.43 ksoftirqd/1
   10 root       0 -20     0    0    0 S   0.0  0.0   0:00.00 cpuset
   11 root       0 -20     0    0    0 S   0.0  0.0   0:00.00 khelper
   12 root      20   0     0    0    0 S   0.0  0.0   0:00.01 kdevtmpfs


sudo /etc/init.d/fhem stop
sudo /etc/init.d/fhem start

Zitat
derron@cubie:~$ sudo /etc/init.d/fhem stop
[sudo] password for derron:
Stopping fhem...
derron@cubie:~$ sudo /etc/init.d/fhem start
Starting fhem...
derron@cubie:~$

Ich lag falsch, ich kann mich nicht per TELNET verbinden, sondern nur per SSH. Ich gehe der Sache mal den Grund.
NUC7i5 | PROXMOX | FHEM 6.2 | 1 HMLAND | 2 UART | HM | LMS | HIFIBERRY | DOORBIRD | BLINK | BUDERUS | HUE | ALEXA | MILIGHT | LUFTDATENINFO | MQTT| ZIGBEE2MQTT | INDEGO | ROBOROCK | SMA | APC | OPENWB

franky08

Deshalb hatte ich gefragt was nach einem reboot passiert, kommentiere das usb create zeugs mal aus.
Debian Bookworm auf HUNSN / Debian Bullseye auf 2.ter HUNSN F2F an 2x RaspiB
mit FHEM aktuell
22Zoll ViewSonic als Infodislay (WVC)
3xHMLAN mit vccu, raspmatic_rpi3, HMIP-HCU1

Morgennebel

Entscheidend ist diese Information:


2016.04.13 08:40:35 1: telnetPort: Can't open server port at 7072: Address already in use. Exiting.


Dein fhem möchte auf Port 7072 lauschen. Kann es aber nicht, weil ein anderes Programm diesen Port bereits nutzt.

Möglichkeiten: reboot (falls ein alter fhem-Prozeß hängen geblieben ist und den Port blockiert). netstat zur Analyse, welcher Prozeß den Port öffnet. Virenscanner :)

Ciao, -MN
Einziger Spender an FHEM e.V. mit Dauerauftrag seit >= 24 Monaten

FHEM: MacMini/ESXi, 2-3 FHEM Instanzen produktiv
In-Use: STELLMOTOR, VALVES, PWM-PWMR, Xiaomi, Allergy, Proplanta, UWZ, MQTT,  Homematic, Luftsensor.info, ESP8266, ESERA