Sprachsteuerung?

Begonnen von sn0000py, 18 August 2017, 08:56:59

Vorheriges Thema - Nächstes Thema

sn0000py

Hallo ich suche nun schon länger rum, aber bin nicht so richtig fündig geworden.

Ich möchte folgendes eine perfekt funktionierendes Sprachgesteuertes Haus und das ganze Offline.
Gibts nicht ich weiss.

Aber was für mich ein No-Go ist
- Ich will nicht sagen müssen "Alexa sag FHEM ....", sondern wenn dann nur "{{KEYWORD}} Befehle"

ich vermute damit scheiden schon mal alle fixen Geräte aus (Alexa, Google Home) oder?

Offline geht soviel ich weiss ja noch gar nicht (Laufen sollte das ganze auf nem Raspberry PI, aber wenn es eine Offline Lösung gibt die nen starken Rechner braucht wäre das auch nicht so das problem)

- Wichtig ist auch noch, das nach dem Befehl, die Reaktion "sofort" erfolgt, ich habe paar Demos auf youtube gesehen, da war die Wartezeit teils eine gefühlte Ewigkeit.

- Als Ausführungsbestätigung sollte dann nur ein Klang kommen (Der sollte teilweise über einen Mediaplayer, oder das Gerät selber kommen) - und wenn ein Text dann wird man wohl oder übel wieder ins Internet müssen.

So nun die konkrekten fragen
- Gibt es gute Offline TextToSpeech und SpeechToText?
- Wenn nur Online, welche ist die beste?
- Als Hotword Detection ist Snowboy noch das beste im moment oder?
- Ablauf so, richtig?
  * Raspberry horcht ständig mit und snowboy meldet irgendwann hotword.
  * Aufnahme des Audiosignals, bis eine hinreichende Lücke kommt
  * Die WAV??? wird an google geschickt (oder Offline wenn es irgendwann mal verfügbar ist)
  * zurück kommt Text
  * der text wird in FHEM dann zerlegt und aufgrund von keywords verabreitet
  * Ausgabe von Klang oder Text (je nach situation)
- Hardware für Mikrofon : Matrix Voice - hat da schon wer Erfahrungen mit? Lieferzeiten (Im Internet steht ab Mai 2017)

ich werde so 4-6 Geräte im Haus verteilt benötigen, je nach dem wie gut es funktioniert.

danke für so viel wie möglichen input

Fixel2012

Zitat von: sn0000py am 18 August 2017, 08:56:59
Hallo ich suche nun schon länger rum, aber bin nicht so richtig fündig geworden.

Ich möchte folgendes eine perfekt funktionierendes Sprachgesteuertes Haus und das ganze Offline.
Gibts nicht ich weiss.

Aber was für mich ein No-Go ist
- Ich will nicht sagen müssen "Alexa sag FHEM ....", sondern wenn dann nur "{{KEYWORD}} Befehle"

ich vermute damit scheiden schon mal alle fixen Geräte aus (Alexa, Google Home) oder?

Offline geht soviel ich weiss ja noch gar nicht (Laufen sollte das ganze auf nem Raspberry PI, aber wenn es eine Offline Lösung gibt die nen starken Rechner braucht wäre das auch nicht so das problem)

- Wichtig ist auch noch, das nach dem Befehl, die Reaktion "sofort" erfolgt, ich habe paar Demos auf youtube gesehen, da war die Wartezeit teils eine gefühlte Ewigkeit.

- Als Ausführungsbestätigung sollte dann nur ein Klang kommen (Der sollte teilweise über einen Mediaplayer, oder das Gerät selber kommen) - und wenn ein Text dann wird man wohl oder übel wieder ins Internet müssen.

So nun die konkrekten fragen
- Gibt es gute Offline TextToSpeech und SpeechToText?
- Wenn nur Online, welche ist die beste?
- Als Hotword Detection ist Snowboy noch das beste im moment oder?
- Ablauf so, richtig?
  * Raspberry horcht ständig mit und snowboy meldet irgendwann hotword.
  * Aufnahme des Audiosignals, bis eine hinreichende Lücke kommt
  * Die WAV??? wird an google geschickt (oder Offline wenn es irgendwann mal verfügbar ist)
  * zurück kommt Text
  * der text wird in FHEM dann zerlegt und aufgrund von keywords verabreitet
  * Ausgabe von Klang oder Text (je nach situation)
- Hardware für Mikrofon : Matrix Voice - hat da schon wer Erfahrungen mit? Lieferzeiten (Im Internet steht ab Mai 2017)

ich werde so 4-6 Geräte im Haus verteilt benötigen, je nach dem wie gut es funktioniert.

danke für so viel wie möglichen input

Ich meine mal gelesen zu haben das Pah und Cooltux beide eine Offline Variante haben. Vielleicht können sie sich zu ihrer Lösung äußern.

Teilweise mit Wandtablets, Amad, autovice, tasker etc. Realisiert. Nachteil an so einer eigenen Lösung ist schlichtweg das Mikrofon. Bei alexa bspw. ist das nicht zu toppen, es ist einfach mit den knapp 10 Mikrofonen fast unschlagbar!
Fhem 5.8 auf Raspi 3, HMLAN und 868MHz CUL mit einigen Komponenten, Z-Wave Rollladenaktoren, Tablet UI, 433 MHz CUL mit Baumarktsteckdosen und Temp Sensoren, Amazon Echo, Echo Dot, 2x SONOS  play1, 1x SONOS Connect AMP,  presence, HUE, Lightify

sn0000py

Zitat von: Fixel2012 am 18 August 2017, 09:36:19
Ich meine mal gelesen zu haben das Pah und Cooltux beide eine Offline Variante haben. Vielleicht können sie sich zu ihrer Lösung äußern.

Teilweise mit Wandtablets, Amad, autovice, tasker etc. Realisiert. Nachteil an so einer eigenen Lösung ist schlichtweg das Mikrofon. Bei alexa bspw. ist das nicht zu toppen, es ist einfach mit den knapp 10 Mikrofonen fast unschlagbar!
Ja wegen den Mikrofonen, gäbe es ja sowas wie "Matrix Voice" Die haben glaub ich ne ähnlich gute Qualität wie Alexa und co.

Eine andere Frage wäre ja auch, ob es jemand geschafft hat die orginal Google Home oder Alex softwaretechnisch neu zu programmieren?

darkness

Hey,

Das hast du schon gesehen?

Gruß

CoolTux

Zitat von: sn0000py am 18 August 2017, 10:50:21
Ja wegen den Mikrofonen, gäbe es ja sowas wie "Matrix Voice" Die haben glaub ich ne ähnlich gute Qualität wie Alexa und co.

Eine andere Frage wäre ja auch, ob es jemand geschafft hat die orginal Google Home oder Alex softwaretechnisch neu zu programmieren?

Mal davon ab das dies unmöglich für einen Privatmann ist, dürfte das auch in Perl in dem Umfang schwer sein.

Auch ich habe aktuell nur eine halbe offline Lösung. Der Knackpunkt ist die Spracherkennung an sich. Ich verwende Google Now für die Spracherkennung. Also landet das gesprochene Wort bei Google, wird dort Analysiert und daraus der Text gemacht.

Der Text wird dann offline von meinen Automagic Skripten analysiert.
Dies war aber bisher nur Recht starr möglich. Daher habe ich beschlossen, da ich eh die Cloud brauche, das ganze komplett da zu machen.
Ich arbeite seit kurzem mit API.ai ich bin Recht angetan von der Einfachheit welche mir Recht komfortabel meine Geräte schaltet mit eigentlich freiem sprechen.



Grüße
Du musst nicht wissen wie es geht! Du musst nur wissen wo es steht, wie es geht.
Support me to buy new test hardware for development: https://www.paypal.com/paypalme/MOldenburg
My FHEM Git: https://git.cooltux.net/FHEM/
Das TuxNet Wiki:
https://www.cooltux.net

sn0000py

Ja habe schon viel herumgelesen ... und bin eh auch zu dem schluss gekommen das eine reine Offline Lösung leider nicht gehen wird.
Ich habe halt immer das Gefühl, das die Online Lösungen für die reine Home Automatisierung teilweise träge sind.

Als Gerät finde ich eh das entweder eine modifizierte Google Now oder Alexa Box oder eben so eine "Matrix Voice" funktionieren kann.
Ein einfaches Mikro oder ein Handy/Tablet fällt für mich weg - glaub nicht das man da eine gute Spracherkennung über einen größeren Raum mit eventuellen Umgebungsgeräusche hinbekommen kann.

CoolTux

GoogleNow wäre ja über Handy/Tablet. Was Du meinst ist GoogleHome. Ich gebe Dir Recht, das mit der Spracherkennung bei Handy oder Tablet ist schwierig. Es gibt Mikrofone die man aufstecken kann, aber dann kannst keine Audioausgabe mehr machen. Die blockieren komplett die Klinkebuchse und damit auch Bluetooth. Klinke kommt vor Bluetooth.
Du musst nicht wissen wie es geht! Du musst nur wissen wo es steht, wie es geht.
Support me to buy new test hardware for development: https://www.paypal.com/paypalme/MOldenburg
My FHEM Git: https://git.cooltux.net/FHEM/
Das TuxNet Wiki:
https://www.cooltux.net