Der RasPi hört aufs Wort [1. Post edit, bessere Lösungen sind da]

Sirphunk · 20 Januar 2014, 22:31:39

Ich möchte mal folgende Lösung vorstellen:
http://stevenhickson.blogspot.de/2013/06/voice-command-v30-for-raspberry-pi.html

Darüber lasse ich einfach per Sprachkommando und wget den Link vom jeweiligen Device öffnen.

Habe auch ein kleines Youtube Video von meinen Tests gemacht:
http://www.youtube.com/watch?v=9XHWhhEDJs0

Die Qualität des Mikrofons ist wohl entscheidend. Das Schlagwort "Computer" wird häufig schlecht erkannt. Danach folgt der eigentliche Befehl der dann immer sehr gut erkannt wird.

Für den Produktiveinsatz ist mir das noch zu ungenau....

Kuzl · 20 Januar 2014, 22:54:19

Klingt echt intressant

Wodurch passiert bei dir die Auswertung des Textes und Umwandlung in einen FHEM-Befehl bzw. in eine Adresse?

Wir sind Hier gerade dabei die Auswerdung des Textes etwas "smarter" zu machen, allerdings henge ich etwas und habe auch nicht so viel Zeit

http://forum.fhem.de/index.php/topic,17409.0.html

Ich bin gespannt auf deine Lösung, bin mir nicht richtig ob ich den richtigen Ansatz gewählt habe

viele Grüße
Kuzl

Sirphunk · 20 Januar 2014, 23:04:32

Hallo Kuzl.

Das ist nicht direkt "meine" Lösung bzw. mein Programm

Das Programm heißt "Voice Command V3.0 for RaspberryPi"und ist ziemlich universell einsetzbar.
Es wird einfach auf vorher festgelegte Sprachkommandos ein Bash-Befehl ausgeführt.

Die Software lauscht die ganze Zeit mit. Fällt das Schlagwort, was ich hier "Computer" genannt habe, dann wird nach Bestätigung, in meinem Fall "Was soll ich tun?" auf den Sprachbefehl gewartet.

Die Kommandos sind in der Config natürlich frei definierbar.

So führt ein

Code Auswählen

~Licht aus==wget http://fritz.box/fhem/LINKzUMaUSSCHALTEN
dazu, dass das Sprachkommando "Licht aus", oder auch "Schalte das Licht aus" den Bashbefehl "wget http://usw.." ausführt.
Dadurch lasse ich einfach den jeweiligen WEBCMD Link vom Device aufrufen und zack, wird geschaltet.

Lässt man die "~" vor dem Kommando weg, wird nur auf den direkten Befehl reagiert. Also führt ein "Licht aus" zum Ergebnis, ein "Schalte das Licht aus" aber nicht...

Das ganze funktioniert über die Google-Api. Sowohl für Sprachein- als auch -ausgabe.
Ist mit Sicherheit noch ausbaufähig, oder ich bräuchte mal ein besseres Mikro.

Kuzl · 20 Januar 2014, 23:27:37

Sehr interessante Lösung

wenn ich mich nicht irre, ist das ~ Regex also, dass es auch übereinstimmt, wenn außer dem Befehl noch andere Worte vorhanden sind, z.b. würde auch "Kannst du bitte das Licht ausschalten" funktionieren, da "Licht aus" genau so enthalten ist.
Allerdings funktioniert das natürlich nur solange es auch genau so enthalten ist. Nicht gehen würde z.b. "Kannst du das Licht bitte ausschalten"

Genau das wollen wir mit der Funktion in dem Thread ändern

ich könnte mir vorstellen, dass man den Text mit "Voice Command" komplett an FHEM übergeben kann, wenn ich daraus mal ein Modul gebastelt habe

dann kann man in FHEM auch beliebig reagieren und kann alles schön übers Webinterface einstellen

Das ist natürlich mega geil, dass erst ein Schlüsselwort genannt werden muss, und dann zugehört wird

Da lässt sich über die Google API natürlich streiten

- für mich allerdings kein Problem.

Ich sehe schon das ganze lässt sich mit dem Modul Text2Speach und... wenn ichs hinkrieg meinem Modul wunderbar in FHEM integrieren

Gruß
Kuzl

Steffen · 21 Januar 2014, 19:47:16

Das hört sich ja sehr sehr interessant an, besonders mit dem Schlagwort.
Habe ja noch ein pi zum testen aber welches mikro benutzt man dafür am Besten?

Mfg Steffen

Rince · 21 Januar 2014, 19:50:40

Mittelfristig evtl. ein Android Handy

Habe es damals mit Singstar Mikros ausprobiert (die ersten Postings in dem Thread), das hat prinzipiell funktioniert, aber her ein Proof of Concept. Nicht für den Alltagsgebrauch geeignet.

fh168 · 22 Januar 2014, 08:22:24

also die singstars mit dem usb-anschluss? gibt es bessere mics? muss man dafür eine usb soundkarte, zb. die 2 euro version aus china dranbauen?

Rince · 22 Januar 2014, 09:49:23

Ich bin kein Tontechniker. Aber ich wette, es gibt viele viel bessere Mikros

Ich hab die Singstars genommen, weil es dazu ein USB Kästchen gab, womit die drahtlos Mikros gehen (also 1 von den beiden, warum, steht am Anfang vom Thread).

Das Problem ist:
Jedes Mikro hat eine Richtcharakteristik. Und je nach dieser richtet sich die Position des Sprechers.

Du willst ja langfristig nicht mit einem Mikro um den Hals oder einem Headset rumlaufen, nur um FHEM nach der Uhrzeit zu fragen oder zu bitten, das Licht jetzt zu dimmen.

Und hier kommen wir in einen Bereich, der technisch komplex wird. Das bedeutet vor allem: teuer.
Drei oder vier Mikros im Raum verteilt, um einerseits deine Sprache optimal zu verstehen, andererseits Hintergrundgeräsche zu filtern...

Vereinfacht hast du das mittlerweile bei besseren Webcams oder auch der Kinect.

Da aber das noch Zukunftsmusik ist, tendiere ich zur Zeit zum Smartphone. Hat ein Mikro eingebaut, an das reinsprechen hat man sich gewohnt, drahtlos ist es auch noch und meist ist die Position Smartphone-Sprecher recht gut

ernie0124 · 22 Januar 2014, 14:25:24

sowas wäre nicht schlecht:

http://www.kickstarter.com/projects/607691307/ubi-the-ubiquitous-computer-voice-activated-and-al-0

fh168 · 22 Januar 2014, 15:29:10

ok, die Singstar kosten ja nicht die Welt, aber sowas wie dem UBI schwebt mir mit Fhem schon vor.
Und ob wir einen UBI oder einen RPi mit einem Mic in die Steckdose stecken, welche untereinander vernetzt sind, da liegen wir preislich sicherlich was drunter.

Aber Voicecommand mit Singstar und Fhem wären ja schon mal ein guter Anfang.

Robin

Steffen · 22 Januar 2014, 18:55:26

Hallo!

Habe gerade von meiner Tochter, ihre Wii Mikrophone(Speedlink) mit Klinke auf Usb Adapter(Rot/Blau) gefunden.

Kann mir jemand bitte vielleicht sagen, wie ich Testen kann auf der Pi console ob sie erkannt werden und Funktionieren???

Mfg Steffen

Kuzl · 22 Januar 2014, 19:44:44

Hallo Steffen,

ich bin mir nicht ganz sicher aber ich glaube das geht mit lsusb

@Rest:
Also ich kann aus Erfahrung (Anfänge mit der Band) sagen, dass bei den Singstar-Micros noch SEEEEEHR viel platz nach oben ist

die sind kurz gesagt für die eigendliche Tonaufnahme fast nicht geeignet

da gibts allerdings für 40€ schon für unseren Zweck brauchbare Micros, die dann auch locker auf eine Entfernung von 1 Meter ganz akzeptable Ergebnisse liefern, und wenn man so eins einfach mal dort, wo man sich am meisten aufhält, platziert ist das doch was

Mal sehen was daraus noch so wird

Fürs Android Handy kann ich nur die App Tasker empfehlen. Dafür gibt es ein FHEM-plugin, welches dann Zustände von FHEM abfragen kann und auch Befehle senden kann. Ich hab damit auch eine kleine Sprachsteuerung gebastelt (Regex ist auch möglich). Allerdings ist das von uns angestrebte gramatikunabhängige Erkennen leider nicht möglich.

Viele Grüße
Kuzl

Steffen · 22 Januar 2014, 22:28:14

Hallo!

So habe es mal versucht Voicecommand zu installieren, aber es scheitert an zwei stellen...
1.

Code Auswählen

First I'm going to say something and see if you hear it Did you hear anything? (y/n) da höre ich leider nichts,
obwohl die Ausgabe von Audio zum Test bei "sudo /usr/bin/mplayer -ao alsa:device=hw=0.0 -nolirc -noconsolecontrols "http://translate.google.com/translate_tts?tl=de&q=test nochmal" habe.
2.

Code Auswählen

Do you want to set up and check the speech recognition options? (y/n)
y
First I'm going to make sure you have the correct hardware device
I couldn't find a hardware device. You don't have a valid microphone

Auch hier:

Code Auswählen

pi@PiAudio ~ $ lsusb
Bus 001 Device 002: ID 0424:9512 Standard Microsystems Corp.
Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
Bus 001 Device 003: ID 0424:ec00 Standard Microsystems Corp.
Bus 001 Device 004: ID 05e3:0606 Genesys Logic, Inc. USB 2.0 Hub / D-Link DUB-H4 USB 2.0 Hub
Bus 001 Device 005: ID 046d:0a03 Logitech, Inc. Logitech USB Microphone
Bus 001 Device 009: ID 03f0:0024 Hewlett-Packard KU-0316 Keyboard
Bus 001 Device 010: ID 046d:0a03 Logitech, Inc. Logitech USB Microphone
Bus 001 Device 008: ID 1bcf:0007 Sunplus Innovation Technology Inc. Optical Mouse

vielleicht hatte ja jemand genau die gleiche Probleme???

Mfg Steffen

Steffen · 01 Februar 2014, 11:33:39

Hallo!

Ich habe nun auch schon mit usb-soundcard versucht, auch mit einer ps3cam doch er zeigt mir immer bei der Config(voicecomand -s) kurz vor schluss das er keine Hardware erkennt.
Woran könnte das liegen, muss man erst dem Pi irgendwo sagen welche Hardware er erkennen muss?
Hat einer von euch schon Voicecomander installiert? Wenn ja welche Hardware, welches System?
Hoffe und bitte um Hilfe...

Mfg Steffen

dieda · 09 Februar 2014, 02:29:13

Bitte bleib dran, das Ganze ist interessant und macht nicht nur für den Sehenden User Sinn. Nur als Basis für die Sprachkomandos sollte man dann auch ein Iphone mit Voice Over in Betracht ziehen. Die Dinger sind die einzigen wirklich guten Blindentelefone https://www.apple.com/de/accessibility/ios/

Der RasPi hört aufs Wort [1. Post edit, bessere Lösungen sind da]

Sirphunk

Sirphunk