[Voicecontrol] Button für Fhemweb

Beta-User · 24 März 2026, 07:41:42

Moin,

die Changes (https://svn.fhem.de/trac/changeset/31010/trunk/fhem/FHEM und https://svn.fhem.de/trac/changeset/31009/trunk/fhem/FHEM) sind doch eher sehr überschaubar

, von daher ist "fleißig" relativ...
War schon vorher überzeugt, dass es ziemlich simpel sein sollte, FULLY als AMAD-Ersatz (sowohl für RHASSPY wie für Babble) zu verwenden, wenn man denn den STT-input "irgendwie" bekommt.

Die größere Aufgabe wird das Feintuning sein

.

Ad Wakeword:
- Rhasspy kann auch diverse Varianten und empfielt Porcupine. Das lief nach meinen (wenigen) Erfahrungen auch auf einem Pi (3B+?) ohne nennenswerte Last.
- Der Gedanke, ständig Audio über das Netz zu schicken, hat mir persönlich noch nie richtig gefallen... Von daher hatte ich zwischenzeitlich auch mal mit Android-Apps rumexperimentiert. Müßte das aber suchen, und wie dann der Link zu FHEMWEB/FULLY wäre, müßte man sich auch ansehen.

Im Moment würde ich eventuell optional die Aktivierung via Näherungssensor@FULLY als sinnvolle Option für Wanddisplays ansehen.

Mein Plan für die nächsten Schritte wäre,
- das Mikro interaktiv wieder zu aktivieren (für Rückfragen bzw. weitere Anweisungen)
- die Audio-Ausgabe mit "Thorsten" zu machen. Ein ebenfalls sehr schmaler Webserver für "Piper" (OHF-Voice/piper1-gpl) läuft bereits, Anleitung wäre hier zu finden: https://github.com/OHF-Voice/piper1-gpl/blob/main/docs/API_HTTP.md
- das auf der RHASSPY-Seite noch so zu ergänzen, dass es auch mit Chrome funktioniert

.

Ansonsten finde ich die 2-gleisigkeit zumindest für den Moment völlig ok. Falls es stört, bitte melden.

An die RHASSPY-User (und eventuelle Interessierte): Falls es spezifische Themen zur dortigen Konfiguration geben sollte - Bitte in einem der RHASSPY-Threads melden oder einfach einen neuen aufmachen.

rudolfkoenig · 25 März 2026, 20:57:49

Ich habe FHEMWEB mit dem publicHostnames Atrtribut erweitert: wenn gesetzt, dann wird ein Zertifikat mit diesen Rechnername/IP-Adressen erstellt.
Weiterhin bekommt man in der Detailansicht von FHEMWEB unter dem Reading publicCertificate einen Link zum oeffentlichen Zertifikat.
Soweit ich sehe, akzetieren die meisten Browser keine IP-Adressen, d.h. um es sinnvoll zu verwenden, muss man FHEM mit dem Rechnernamen aufrufen.

Auf meiner TODO Liste ist noch die eindeutige Client-Kennung fuer die STT Nachrichten.
Da hier sehr viel geschrieben wurde, und ich nicht sicher bin, dass ich alles verstanden habe: kann mir noch jemand zusammenfassen, was in f18 noch eingebaut werden sollte?

Beta-User · 26 März 2026, 09:41:49

Zitat von: rudolfkoenig am 25 März 2026, 20:57:49Da hier sehr viel geschrieben wurde, und ich nicht sicher bin, dass ich alles verstanden habe: kann mir noch jemand zusammenfassen, was in f18 noch eingebaut werden sollte?

Hier mal der Versuch einer Zusammenfassung anhand des angehängten diff:

1.

Code Auswählen

   f18_setWidePortrait();
+  if (typeof fully !== 'undefined')
+    FW_cmd(FW_root + "?cmd=set TYPE=FULLY:FILTER=deviceid=" + fully.getDeviceId() + " host " + fully.getHostname() + "&XHR=1");
 });

Das ist eine Hilfe für das FULLY-Modul. Das Modul war bisher mit fester IP oder festem hostname einzurichten, was dann nicht klappt, wenn das Android nicht speziell so konfiguriert wird, dass im jeweiligen WLAN immer dieselbe MAC-Adresse bekannt gegeben wird.
Aus meiner Sicht wäre das eine dringende Bitte, es sei denn, wir wollen alle fully-spezifischen Einstellungen in eine eigene .js auslagern. Dann käme das da rein.

2.

Code Auswählen

-  if(!window.SpeechRecognition)
+  var Recognition = window.SpeechRecognition || window.webkitSpeechRecognition;
+  var isFully = (typeof fully !== 'undefined' && typeof fully.startSpeechRecognition === 'function');
+
+  if (!Recognition && !isFully)
     return FW_okDialog("SpeechRecognition Interface missing");

-  var stt = new SpeechRecognition();
+  if (isFully) {
+    fully.startSpeechRecognition("", false);
+    window.onSpeechRecognitionResult = function(result) {
+      if (result) {
+         FW_cmd(FW_root + "?cmd=set TYPE=FULLY:FILTER=deviceid=" + fully.getDeviceId() + " STTinput " + encodeURIComponent(txt) + " [" + $("body").attr("fw_id") + "]&XHR=1");
+      }
+    };
+    return;
+  }
+
+  var stt = new Recognition();

Das ist der übernommene patch-Vorschlag von schwatter. Der Teil funktioniert bei mir nicht, das könnte eventuell für eine frühere fully-Version hilfreich sein.

Den Teil würde ich im Moment NICHT dringend ins svn übernehmen und erst mal warten, ob das mit (halbwegs) aktuellen Android-Modellen überhaupt auftritt (oder auch mit älteren der nachfolgende Teil ausreicht):

3.

Code Auswählen

-      if(doSend && txt)
+      if(doSend && txt){
+        if (typeof fully !== 'undefined')
+          FW_cmd(FW_root + "?cmd=set TYPE=FULLY:FILTER=deviceid=" + fully.getDeviceId() + " STTinput " + encodeURIComponent(txt) + " [" + $("body").attr("fw_id") + "]&XHR=1");
         FW_cmd(FW_root+"?cmd=setreading "+$("body").attr("data-webName")+
                " STT "+encodeURIComponent(txt)+"&XHR=1");
+      }
+

Damit bekommt man die für die jetzige svn-Fassung von FULLY erforderlichen Infos im von schatter vorgeschlagenen Format (in eckigen Klammern angehängte FW_ID).

Anders formuliert:
Mit den patch-Teilen 1 und 3 könnte Gisbert nach einem update mit testen. Er würde nur (in FHEM) ein FULLY-Device benötigen und müßte dort im Attribut "STTprocessor" auf sein "zuständiges" RHASSPY-Device verweisen, und dazu noch die STT-Option in f18 aktivieren. Dann sollte es zumindest mit installiertem fully (mit PLUS-Lizenz) funktionieren, von dort aus Sprachbefehle via f18 einzusprechen und die passende Antwort zu erhalten.

Meine (komplettere) Wunschliste würde ich dann später mal posten, und vorher eventuell noch das eine oder andere Testen.

Gisbert · 26 März 2026, 11:41:52

Zitat von: Beta-User am 26 März 2026, 09:41:49Anders formuliert:
Mit den patch-Teilen 1 und 3 könnte Gisbert nach einem update mit testen. Er würde nur (in FHEM) ein FULLY-Device benötigen und müßte dort im Attribut "STTprocessor" auf sein "zuständiges" RHASSPY-Device verweisen, und dazu noch die STT-Option in f18 aktivieren. Dann sollte es zumindest mit installiertem fully (mit PLUS-Lizenz) funktionieren, von dort aus Sprachbefehle via f18 einzusprechen und die passende Antwort zu erhalten.

Hallo Jörg,

ich bin gerne bereit zu testen, falls euch das in der Entwicklung weiterhilft. Dazu müsste ich aber genau wissen, was ich zu tun habe. Das Ziel kann ich wohl erkennen, aber die einzelnen Schritte dazu verstehe ich noch nicht.
Falls dein Ansinnen nur dazu da ist, mich mit meinem Sonderweg(? - RHASSPY, AMAD, Automagic, Google Speech Service) zu begleiten, dann ist das nicht nötig. Ich warte gerne, bis ein testreifer Zustand erreicht ist, und ich wie oben geschildert einsteigen kann.

Viele Grüße Gisbert

schwatter · 26 März 2026, 18:06:40

@beta-user

zu 2.
Ich habe gerade nochmal Fully auf meinem LineageOS 23.2, sprich Android 16 installiert. Mit dem Patch aus #35
funktioniert das Mikro von Rudolf bei mir auch. Ich verstehe nicht, warum das bei dir nicht funktioniert.

@Rudolf
Danke für das einbauen um direkt Zertifikate zu generieren. Ich habe es gerade auf meinem Handy mit Chrome getestet.
Eine Verbindung mit http://hostname:8083/fhem konnte ich aufbauen. Leider kommt ständig
"Connection lost try reconnect evvery 5 sek." Ab und zu kann ich mich durch mein Fhem klicken. Woher können die
Abbrüche kommen? Longpoll habe ich auf websocket. Mit Verbose 5 sehe ich nichts. Ich muss mal ADB anschmeißen.

edit:
Hat sich erstmal erledigt. Ich habe nicht gesehen das ich auf http zugegriffen habe...Die doofe Adresszeile blendet das ja immer aus....
Ich denke jetzt ist es ok.

edit2:
Fully benötigt in den Einstellungen die Option ,,Ignore SSL Errors", damit HTTPS funktioniert.
Auf meinem Firmenhandy trat das Problem ebenfalls auf, bis mir aufgefallen ist, dass ich ja Private DNS (dns.adguard.com) konfiguriert hatte. Nach dem Deaktivieren des privaten DNS funktionierte die Verbindung problemlos.

edit3:
Außerdem kann ich bestätigen, das das Mikro von Rudolf in f18 und Semi-HTTPS funktioniert. Super.

Gruß schwatter

rudolfkoenig · 26 März 2026, 22:19:40

ZitatMit den patch-Teilen 1 und 3 könnte Gisbert nach einem update mit testen.

Ich habe das auch so eingecheckt.

Weiterhin habe ich das Generieren des Zertifikats umgebaut.
Da aktuelle Browser keine selbstsignierten Zertifikate akzeptieren, wird erst ein CA Zertifikat erzeugt, und damit das FHEMWEB Zertifikat signiert.
Zum Download wird jetzt das CA Zertifikat angeboten, das muss man installieren.
Hat den weiteren Vorteil, dass beim Anpassen des FHEMWEB Zertifikates nichts mehr installiert werden muss, da (wenn einmal vorhanden) das CA Zertifikat nicht mehr geaendert wird.

schwatter · 26 März 2026, 22:41:38

Ich habe noch 2 Anmerkungen

1. Wenn puplicHostnames gesetzt und dann HTTPS auf 1 blockiert mein Browser. Ein Neustart cancelt dann den Save?

2. puplicHostnames ohne Domain sind schlecht, da in Chrome z.B. keine Logindaten gespeichert werden können. Mh, wird .local verschluckt?

Grußs schwatter

Beta-User · 26 März 2026, 23:06:37

Zitat von: rudolfkoenig am 26 März 2026, 22:19:40Ich habe das auch so eingecheckt.

Danke!

Zitat von: schwatter am 26 März 2026, 18:06:40@beta-user

zu 2.
Ich habe gerade nochmal Fully auf meinem LineageOS 23.2, sprich Android 16 installiert. Mit dem Patch aus #35 funktioniert das Mikro von Rudolf bei mir auch. Ich verstehe nicht, warum das bei dir nicht funktioniert.

Kann durchaus sein, dass ich beim Testen was falsch gemacht habe, werd's bei Gelegenheit nochmal durchspielen. fully ist/war zumindest bei den ersten Tests ziemlich zickig, was die Akzeptanz des geänderten js anging, und mit der Sprache selbst fremdle ich auch noch ziemlich, und war vor allem froh, als es dann "irgendwie" und irgendwann überhaupt funktioniert hat

.

Zitat von: Gisbert am 26 März 2026, 11:41:52ich bin gerne bereit zu testen, falls euch das in der Entwicklung weiterhilft. Dazu müsste ich aber genau wissen, was ich zu tun habe. Das Ziel kann ich wohl erkennen, aber die einzelnen Schritte dazu verstehe ich noch nicht.

Falls (!) ich das richtig zusammengepuzzelt habe, wäre Schritt 1, das neue "publicHostnames"-Attribut an dem FHEMWEB-Device zu setzen, über das du in fully (sofern vorhanden) oder Chrome auf FHEM zugreifst, und im Browser nicht die IP-Adresse einzugeben, sondern den hostname.

2. Im Moment müßte f18 als Style gewählt sein und in den f18-Style-Einstellungen dann die Option STT aktiviert werden.

Dann solltest du nach dem Neuladen der FHEMWEB-Seite (eventuell nach Bestätigung des Zugriffs auf das Mikro) mit einem Klick auf das neu hinzugekommene Mikrofon-Symbol das Dialogfeld erhalten und was einsprechen können, das dann nach Klick auf "OK" an der FULLY-Instanz (falls angelegt) und zusätzlich am FHEMWEB-Device als Reading landet (auch hier ggf. die Seite neu laden, damit das neu angelegte Reading sichtbar wird).

3. Um das mit RHASSPY zu koppeln, wäre dann am FULLY-Device einfach der Name des RHASSPY-Devices einzutragen (Attribut: STTprocessor).

4. Frage nach der Uhrzeit, schalte das Licht ein, usw.. Im Moment braucht man dazu eine PLUS-Lizenz, weil (intern) der reguläre "speak"-Befehl genutzt wird. Ansonsten ist am FULLY-Device zu sehen, was geantwortet worden wäre.

5. Weitere Tests: Mal sehen...
So oder so: vermutlich ist der Hauptteil erst mal jeweils die js zu tauschen (und den Browser zu überreden, die auch zu laden). Da steckt jeweils erst mal die meiste Funktionalität drin, den FULLY/RHASSPY-Teil würde ich dann via svn bereitstellen, vermutlich schlicht im regulären update.
Mein nächstes Zwischenziel wäre in Richtung Bedienbarkeit v.a. die Möglichkeit, von FHEM aus das Mikro wieder aufzumachen. Sollte eigentlich auf Basis von dem "welche Optionen gibt es"-Schnippsel von schwatter zu machen sein...

schwatter · 28 März 2026, 12:02:04

Mahlzeit,

ich habe mir für WakeWord-only einen Atom EchoS3R gekauft. Hat etwas gedauert bis ich wieder mit ESPHome drinne war,
aber nu klappt es sehr gut. Für den Anfang mit Alexa als Wakeword. Wenn erkannt, sendet er an das Topic
atom_echos3r_9888e00f4280:atom_echo/wakeword:.* wakeword.
Mein Plan, kleinen "Male to Male" adapter und den ESP direkt in den USB_Port von meinem FireHD 10 Plus, welches per
per Induktion geladen wird. Der kleine ist echt schnell und auch die Reichweite ist passabel. Google SpeechToText
klappt auch, aber das muss ich noch besser anbinden.

Code Auswählen

defmod atom_echos3r_9888e00f4280 MQTT2_DEVICE atom_echos3r_9888e00f4280
attr atom_echos3r_9888e00f4280 readingList atom_echos3r_9888e00f4280:atom_echo/debug:.* debug\
atom_echos3r_9888e00f4280:esphome/discover/atom-echos3r:.* { json2nameValue($EVENT) }\
atom_echos3r_9888e00f4280:atom_echo/status:.* status\
atom_echos3r_9888e00f4280:homeassistant/binary_sensor/atom-echos3r/atom_button/config:.* { json2nameValue($EVENT) }\
atom_echos3r_9888e00f4280:atom_echo/binary_sensor/atom_button/state:.* state\
atom_echos3r_9888e00f4280:atom_echo/wakeword:.* wakeword
attr atom_echos3r_9888e00f4280 room MQTT2_DEVICE

setstate atom_echos3r_9888e00f4280 OFF
setstate atom_echos3r_9888e00f4280 2026-03-28 10:51:51 IODev myFhembroker
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 avty_t atom_echo/status
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 board esp32-s3-devkitc-1
setstate atom_echos3r_9888e00f4280 2026-03-28 12:02:47 debug ␛[0;;36m[D][esp32.preferences:144]: Writing 1 items: 0 cached, 1 written, 0 failed␛[0m
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 dev_cns_1_1 mac
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 dev_cns_1_2 9888e00f4280
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 dev_ids 9888e00f4280
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 dev_mdl esp32-s3-devkitc-1
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 dev_mf Espressif
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 dev_name Atom Echo Alexa
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 dev_sw 2026.3.1 (config hash 0x3315fe1d)
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 friendly_name Atom Echo Alexa
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 ip 192.168.1.77
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 mac 9888e00f4280
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 name Atom Button
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 network wifi
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 platform ESP32
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 port 6053
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 stat_t atom_echo/binary_sensor/atom_button/state
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 state OFF
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 status online
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 uniq_id ESPbinary_sensoratom_button
setstate atom_echos3r_9888e00f4280 2026-03-28 12:01:48 version 2026.3.1
setstate atom_echos3r_9888e00f4280 2026-03-28 11:47:09 wakeword alexa_detected

Hier die original Yaml:
https://github.com/m5stack/esphome-yaml/blob/main/common/atom-echos3r-satellite-base.yaml

Meine angepasste für Fhem im Anhang.
Edit:
Jetzt immer in #1

Gruß schwatter

schwatter · 28 März 2026, 17:07:29

Update im ersten Post

echo_s3r.yaml und voicecontrol_echo_s3r.js hinzugefügt. Der Echo s3r erkennt Alexa und sendet wie gesagt per
MQTT an Fhem. Das JS lauscht im Moment per Websocket im Hintergrund nach dem Reading wakeword. Erkennt es
alexa_detected wird Google SpeechToText freigeschaltet. Funktioniert jetzt dauerhaft top.
Vielleicht könnte ich auch im JS das Topic einfach abonnieren? Mal sehen, jetzt gerade ist es sehr
robust. Bitte lacht nicht, das Javascript ist ne Mischung aus James und Alexa. Der Umstand halt, früher
oder später wollte ich James mal trainieren.

Wer Interesse hat, es wird nur der Atom Echo s3r benötigt. Habe ich bei Botland gekauft. Kommt aus Polen
und dauert auch nur 2 Tage.
https://botland.de/atom-serie/27570-atom-echos3r-programmierbarer-lautsprecher-esp32-m5stack-c126-echo-6972934176189.html

Abscheckend kann ESPHome sein. Manchmal etwas kniffelig beim aufsetzen. Ich hatte erst das neuste Python installiert
und bin auf die Nase gefallen. Bei 3.13 ist gerade Ende. Habe dann 3.12 installiert.

Edit:
Werde ab und zu Infos in Post #1 hinzufügen.

Gruß schwatter

schwatter · 30 März 2026, 20:03:29

Nabend,

ich habe das Eingangspost bearbeitet und auch einen Wikieintrag erstellt.

Gruß schwatter

Beta-User · 30 März 2026, 21:30:06

Hallo zusammen,

sieht so aus, als wäre es eventuell lohnend, den M5-Atom-Echo nochmal aus der Grabbel-Kiste zu holen. Hatte mal mit dem als Rhasspy-Satelliten experimentiert: https://community.rhasspy.org/t/m5-atom-echo-as-satellite/1784, vermutlich ist das noch keine S3-Variante.

Es gibt die Dinger übrigens auch mit Display: https://github.com/RealDeco/xiaozhi-esphome?tab=readme-ov-file

Habe im Moment noch andere Baustellen, von daher kann ich das Tempo im Moment nicht mitgehen.
Sehr cool ist jedenfalls auch das mit dem WebApp-Support. Nach der Anleitung von https://forum.fhem.de/index.php?msg=1360621 ist es mir auch gelungen, zumindest unter Chrome@Android ohne allzugroße Umstände mein Testsystem fullscreen auf dem Handy angezeigt zu bekommen und was einsprechen zu können. Von daher werde ich wohl erst mal versuchen RHASSPY so aufzubohren, dass das mit FHEMWEB-Events umgehen kann und passende Antworten ausspricht

, ohne dass man dafür FULLY/fully benötigt.

Bezüglich Doku und Installation etc.: Ist geplant, die für die global-notify-Lösung benötigten .js-Files ins svn (contrib) zu bringen?

Damit das Ganze für später Lesende nicht zu verwirrend wird, ist es vermutlich besser, für die RHASSPY-spezifischen Themen dann einen neuen Thread aufzumachen, oder?

schwatter · 30 März 2026, 22:15:53

Zitat von: Beta-User am 30 März 2026, 21:30:06Hallo zusammen,

sieht so aus, als wäre es eventuell lohnend, den M5-Atom-Echo nochmal aus der Grabbel-Kiste zu holen. Hatte mal mit dem als Rhasspy-Satelliten experimentiert: https://community.rhasspy.org/t/m5-atom-echo-as-satellite/1784, vermutlich ist das noch keine S3-Variante.

Es gibt die Dinger übrigens auch mit Display: https://github.com/RealDeco/xiaozhi-esphome?tab=readme-ov-file

Ja, wenn du Zeit findest, mach mal. Die mit dem Display finde ich auch ganz nett. Meinen jetzigen finde ich super,
da er so klein ist und wie ein Hörgerät am Usb-Port hängt.
Und mein James Wakeword brauche ich auch nicht mehr trainieren. Es gibt eine große Sammlung.

https://github.com/TaterTotterson/microWakeWords

Das einbinden habe ich im Wiki auch beschrieben.

Zitat von: Beta-User am 30 März 2026, 21:30:06Habe im Moment noch andere Baustellen, von daher kann ich das Tempo im Moment nicht mitgehen.
Sehr cool ist jedenfalls auch das mit dem WebApp-Support. Nach der Anleitung von https://forum.fhem.de/index.php?msg=1360621 ist es mir auch gelungen, zumindest unter Chrome@Android ohne allzugroße Umstände mein Testsystem fullscreen auf dem Handy angezeigt zu bekommen und was einsprechen zu können. Von daher werde ich wohl erst mal versuchen RHASSPY so aufzubohren, dass das mit FHEMWEB-Events umgehen kann und passende Antworten ausspricht , ohne dass man dafür FULLY/fully benötigt.

Das Feature finde ich super, danke hier nochmal an Rudolph für HTTPS und WebAPP Support.

Zitat von: Beta-User am 30 März 2026, 21:30:06Bezüglich Doku und Installation etc.: Ist geplant, die für die global-notify-Lösung benötigten .js-Files ins svn (contrib) zu bringen?

Ja kann ich machen. Dann können sich interessierte User das Script aus dem contrib nach /fhem/www/pgm2 kopieren.

Zitat von: Beta-User am 30 März 2026, 21:30:06Damit das Ganze für später Lesende nicht zu verwirrend wird, ist es vermutlich besser, für die RHASSPY-spezifischen Themen dann einen neuen Thread aufzumachen, oder?

Ja, ich denke jetzt ist es an der Zeit, da es jetzt doch sehr auseinander driftet.

Btw:
Das notify überarbeite ich auch noch. Damit ist durch Filtern mehr natürliche Sprache möglich:

Code Auswählen

global:STT:.* {

  my ($cleanEvent, $clientId) = $EVENT =~ /^(.*)\s\[(.*)\]$/;
  $cleanEvent //= $EVENT;
  $clientId   //= "unknown";

  my $event_lc = lc($cleanEvent);

  # ---------------------------
  # Text bereinigen (optional)
  # ---------------------------
  $event_lc =~ s/\b(ich|brauche|mach|bitte|kannst du|würdest du|mal|doch)\b//g;

  # ---------------------------
  # Synonyme
  # ---------------------------
  my %rooms = (
    "esszimmer" => "Lampe01_Ez",
    "küche"     => "Deckenlampe_Kue",
  );

  my %onWords  = map { $_ => 1 } qw(an ein einschalten schalte starte aktivier aktiviere);
  my %offWords = map { $_ => 1 } qw(aus ausschalten schalte stop stoppe beende deaktivier deaktiviere);

  # ---------------------------
  # INTENT: LICHT
  # ---------------------------
  if ($event_lc =~ /(licht|lampe)/) {

    my ($room) = grep { $event_lc =~ /\b$_\b/ } keys %rooms;

    my $cmd;
    if (grep { $event_lc =~ /\b$_\b/ } keys %onWords) {
      $cmd = "on";
    }
    elsif (grep { $event_lc =~ /\b$_\b/ } keys %offWords) {
      $cmd = "off";
    }

    if ($room && $cmd) {
      fhem("set $rooms{$room} $cmd");
      return;
    }
  }

  # ---------------------------
  # INTENT: FERNSEHER
  # ---------------------------
  if ($event_lc =~ /(fernseher|tv)/) {

    if (grep { $event_lc =~ /\b$_\b/ } keys %onWords) {
      fhem("set VuPlus on");
    }
    elsif (grep { $event_lc =~ /\b$_\b/ } keys %offWords) {
      fhem("set VuPlus off");
    }

    return;
  }

  # ---------------------------
  # INTENT: STAUBSAUGER
  # ---------------------------
  if ($event_lc =~ /(reinige|sauge|putze)/) {

    my %roomsVac = (
      "arbeitszimmer" => "Arbeitszimmer",
      "badezimmer"    => "Badezimmer",
      "esszimmer"     => "Esszimmer",
      "flur"          => "Flur",
      "küche"         => "Küche",
      "wohnzimmer"    => "Wohnzimmer"
    );

    my @found = grep { $event_lc =~ /\b$_\b/ } keys %roomsVac;

    if (@found) {
      fhem("set MQTT2_valetudo_FlusteredUnequaledFish clean_segment " .
        join(",", map { $roomsVac{$_} } @found));
    }

    return;
  }

  # ---------------------------
  # INTENT: AMBIENTE
  # ---------------------------
  if ($event_lc =~ /ambiente/) {

    if ($event_lc =~ /(\d+)/) {
      my $b = ($1 > 255 ? 255 : ($1 < 1 ? 1 : $1));
      fhem("set LampeSzeneAlle brightness $b");
    }
    elsif (grep { $event_lc =~ /\b$_\b/ } keys %onWords) {
      fhem("set LampeSzeneAlle on");
    }
    elsif (grep { $event_lc =~ /\b$_\b/ } keys %offWords) {
      fhem("set LampeSzeneAlle off");
    }

    return;
  }

  # ---------------------------
  # INTENT: AMBILIGHT (SSH)
  # ---------------------------
  if ($event_lc =~ /ambilight/) {
    system("sshpass -p '1431Fhem1982' ssh -o StrictHostKeyChecking=no root\@192.168.1.46 '/usr/share/hyperhdr/scripts/hyperhdr_toggle.sh'");
    return;
  }

  # ---------------------------
  # INTENT: LADESTATION
  # ---------------------------
  if ($event_lc =~ /(lade|aufladen|dock)/) {
    fhem("set MQTT2_valetudo_FlusteredUnequaledFish charge");
    return;
  }

  # ---------------------------
  # HILFE
  # ---------------------------
  if ($event_lc =~ /(hilfe|kommandos)/) {

    my $h = '<div style="text-align:left;;min-width:200px;;font-family:sans-serif;;"><b>Beispiele:</b><br><br>';
    $h .= "• Licht im Esszimmer an<br>";
    $h .= "• Küche Licht aus<br>";
    $h .= "• Reinige Wohnzimmer<br>";
    $h .= "• Ambiente 120<br>";
    $h .= "• Fernseher an<br></div>";

    $h =~ s/'/\\"/g;

    my $js = "if((document.querySelector('input[name=\"fw_id\"]')||{}).value==='$clientId'){FW_okDialog('$h')}";

    FW_directNotify("#FHEMWEB:$_", $js, "")
      for devspec2array("TYPE=FHEMWEB");

    return;
  }
}

Gruß schwatter

Beta-User · 03 April 2026, 11:27:30

(v.a.) @Rudi
Habe nochmal etwas rumexperimentiert mit "interimResults".
Zumindest auf Chrome unter Android hat man zum einen die direkte Rückmeldung über die Zwischenergebnisse und nur eine einmalige Anzeige des Endergebnisses:

Code Auswählen

var stt = new Recognition();
  stt.continuous = true;
  stt.interimResults = true;
  stt.lang = $("body").attr("data-language") == "EN" ? "en-US":"de-DE";

  var doSend = false;
  var txt = '';

  stt.onresult = function(e){
    var interim_txt = '';

    for(var i1=event.resultIndex; i1<event.results.length; ++i1) {
      if (event.results[i1].isFinal) {
        txt = event.results[i1][0].transcript;
        $("#f18_stt").html(txt);
      } else {
        interim_txt += event.results[i1][0].transcript;
        $("#f18_stt").html(interim_txt);
      }
    }
  };

Zitat von: schwatter am 30 März 2026, 22:15:53Ja kann ich machen. Dann können sich interessierte User das Script aus dem contrib nach /fhem/www/pgm2 kopieren.

Thx. Vielleicht dann noch die dynamischen Teile (insbes. $FW_id?) vorher anpassen, so dass das etwas weniger manueller Anpassung durch interessierte User braucht?

Zitat von: schwatter am 30 März 2026, 22:15:53Ja, ich denke jetzt ist es an der Zeit, da es jetzt doch sehr auseinander driftet.

Folgethread wäre hier zu finden: https://forum.fhem.de/index.php?topic=144370.0

schwatter · 03 April 2026, 18:46:05

Hallo zusammen,

das voicecontrol.js liegt jetzt im contrib. Das ist die Version für PushToTalk oder kurz AlwaysOn.
Außerdem hat das notify jetzt eine zentrale Mappingtabelle. Mit der ist es möglich, ein Hauptkeyword mit
diversen Filtern zu setzen. Ich hoffe damit ist es Userfreundlicher.

Beispiel:

Code Auswählen

"esszimmer:licht|lampe|deckenlampe" => { dev => "Lampe01_Ez", label => "Licht Esszimmer", cmdOn => "on", cmdOff => "off" }

Aufschlüsselung:

Code Auswählen

"hauptkeyword:Filter1|Filter3|Filter3" => { dev => "Devicename", label => "Übersichtname", cmdOn => "on", cmdOff => "off" }

Ich habe dazu das Wiki weiter angepasst:
https://wiki.fhem.de/wiki/FHEMWEB/VoiceControl:_Web-STT_%26_Hardware-Wakeword

Zitat von: Beta-User am 03 April 2026, 11:27:30
Zitat von: schwatter am 30 März 2026, 22:15:53Ja kann ich machen. Dann können sich interessierte User das Script aus dem contrib nach /fhem/www/pgm2 kopieren.
Thx. Vielleicht dann noch die dynamischen Teile (insbes. $FW_id?) vorher anpassen, so dass das etwas weniger manueller Anpassung durch interessierte User braucht?

Mh, anpassen muss man da eigentlich nichts? Das Javascript kopieren und laden. Das notify erstellen und los gehts.

Edit:
Ganz vergessen. Mit dem notify können jetzt auch mehrere Befehle kombiniert werden:

Code Auswählen

Ich: James!?
James: Ja?
Ich: Schalte das Licht in der Küche aus und schalte das Licht im Esszimmer an.
James: Erledigt!

Gruß schwatter