Modulentwicklung für Rhasspy Sprachassistent

laberlaib · 26 März 2021, 13:40:42

Zitat von: Beta-User am 25 März 2021, 22:21:06
Schon alleine wegen der cref: Mit ziemlicher Sicherheit => die letzte hier angehängte!
(EDIT: Ist nun auch im git unter https://github.com/drhirn/fhem-rhasspy/blob/0.4.6a/10_RHASSPY.pm verfügbar.)
Ich _glaube_, dass es möglich sein sollte, zwei (oder mehr) rhasspy-Dienste parallel laufen zu lassen (auf derselben Plattform), einen mit de-profile und einen mit "es", das ganze über einen Broker.

In der aktuellen cref sind ein paar Hinweise drin, wie ich _glaube/mir nach jetzigem Stand vorstelle_, dass man mehrere RHASSPY-Instanzen auf einem FHEM laufen haben kann.
Das habe ich nicht verstanden, ich würde optimalerweise MQTT-Rohdaten benötigen (siehe die Beispiele im Repo von drhirn), dann wird es evtl. klarer.

(Ich will nicht in dem anderen Thread zu viele Anwenderdetails diskutieren, die ich sowieso vermutlich noch nicht im Detail nachvollziehen kann; wenn es spezielle Themen gibt, die mit Mehrsprachigkeit zu tun haben, bitte melden und ggf. einfach einen neuen Thread dazu aufmachen?)

Danke wieder Mal für den ganzen Aufriss.
Das SNIPS-Modul hab ich sogar halbwegs verstanden, das was hier gerade entsteht...

Mehrere RHASSPY-FHEM-Instanzen sind nicht das Problem bei mir, da ich ja einfach alles doppelt anlegen kann - wie dann die Slots geupdatet werden ist eher ein Luxusproblem, zur Not mach ich das manuell bzw. bau mir irgendwas.
Das Problem ist eher, dass sich in Rhasspy die Services gegenseitig in die Quere kommen und dann mehrfach gestartet werden, wenn da zwei Master auf dem selben Broker laufen. Weil nur der Dialogservice kann nach Wakeword unterscheiden, die anderen nehmen die siteID. D.h. sobald die Soundübertragung von einem Satellite "Wohnzimmer" losgeht, dann hören beide Master zu und das setzt sich dann fort. Ich hatte dann nach einem Wakeword 2^3 = 8 Resultate: 1 Wakeword aktiviert 2 Soundstreams welche an 2 Spracherkenner weitergegeben werden und diese wieder rum an 2 Intenterkenner (oder so ähnlich).

Du hast mich gerade aber auf die Idee gebracht, zwei Instanzen auf einem Satelliten laufen zu lassen, unterschiedliche Wakewords dran zu hängen und unterschiedliche SiteId (Wohnzimmer, salon) zu geben und dann den SiteID-Trennermechanismus zu nutzen. Das wird vermutlich an der gleichzeitigen Nutzung der Soundhardware scheitern. Außer wiederum das wäre mit Pulseaudio irgendwie geregelt zu bekommen...
Dann bin ich aber wieder beim reinfrickeln in Software und da schlägt für mich derzeit MQTT-Gefrickel Pulseaudiogefrickel um längen. Ersteres ist irgendwie transparent, verständlich und im MQTT-Explorer nachvollziehbar; letzteres eine Blackbox.

Den Groupseperator erläutere ich bei Gelegenheit.

Beta-User · 26 März 2021, 14:08:39

Auf die Schnelle ein paar Gedanken dazu:

Zitat von: laberlaib am 26 März 2021, 13:40:42Danke wieder Mal für den ganzen Aufriss.

Gerne

!

Zitat
Das SNIPS-Modul hab ich sogar halbwegs verstanden, das was hier gerade entsteht...

Das SNIPS-Modul kannte ich nicht, aber m.E. ist durch die ganzen Änderungen vieles für die Einrichtung _vereinfacht_ worden. Insbesondere ist es durch die "language" und "prefix"-Optionen möglich, zwei sehr unterschiedliche Instanzen von RHASSPY in einem FHEM laufen zu lassen - beide jeweils mit einem anderen "Master" (an der Stelle fremdlich ich noch etwas mit den Begrifflichkeiten), also der eine z.B. auf localhost:12101 und der andere auf localhost:12102.

Aber falls das die Rückmeldung war, dass die cref in der jetzigen Form (noch) nicht verständlich ist: Bin für Verbesserungsvorschläge offen (und drhirn vermutlich dankbar!)...

Zitat
Mehrere RHASSPY-FHEM-Instanzen sind nicht das Problem bei mir, da ich ja einfach alles doppelt anlegen kann - wie dann die Slots geupdatet werden ist eher ein Luxusproblem, zur Not mach ich das manuell bzw. bau mir irgendwas.

Wenn jede RHASSPY-Instanz ihren Master kennt, sollten auch die (von FHEM aus geschriebenen) slots sauber up-to-date zu halten sein.

Zitat
Das Problem ist eher, dass sich in Rhasspy die Services gegenseitig in die Quere kommen und dann mehrfach gestartet werden, wenn da zwei Master auf dem selben Broker laufen. [...]

Ich kann zwar das Problem erahnen, aber eigentlich müßte das ganze doch so intelligent sein, dass "erst mal" nur der (jeweilige) Master aufgeweckt wird (setzt unterschiedliche Wakewords voraus) und halt "seinen" Dialog mit dem einen Satelliten führt. Aber evtl. fehlt mir da noch die praktische Erfahrung mit dem Ganzen.

Zitat[...] Pulseaudiogefrickel [...]

Falls dir das Stichwort MPD was sagt: Auf der Hardware, auf der mein derzeitiger Master untergegracht ist, läuft auch ein MPD. Da ich von daher wußte, dass Audioausgaben durch unter anderen Usern laufende Services ein ziemlicher Showstopper sind, habe ich es vorsichtshalber für rhasspy genauso gemacht: beides wird in der user-Sphäre nach (automatischem) login automatisch gestartet, so dass auch (gleichzeitiger) Zugriff auf die Soundschnittstellen gar kein Problem sind (bzw. wären...).
Der Artikel hier wäre ggf. ein geeigneter Startpunkt: https://wiki.ubuntuusers.de/MPD/MPD_auf_der_Benutzerebene/

Und dem Bauchgefühl nach müßte es auch möglich sein, rhasspy doppelt unter demselben User mit unterschiedlichen Profilen zu starten.

drhirn · 26 März 2021, 14:55:20

Zitat von: Beta-User am 26 März 2021, 14:08:39
Und dem Bauchgefühl nach müßte es auch möglich sein, rhasspy doppelt unter demselben User mit unterschiedlichen Profilen zu starten.

Das ist ganz sicher so.

Wichtig für laberlaib: Du brauchst natürlich zwei unterschiedliche Broker! In Folge dessen auch 2 MQTT2_DEVICEs.

laberlaib · 26 März 2021, 15:02:37

Sicher ist alles einfacher geworden und alle festen Texte sind raus, aber sowas