Neues Modul: Text2Speech

Navigator · 16 Mai 2014, 14:05:04

so ein mist...so ein Klasse Modul, nur bei mir gehts wieder nicht. Das Verzeichnis ist da, Zugriffsrechte prüfe ich noch mal. Die Datei vom ersten erfolgreichen Versuch liegt noch drin. Mich wundert das die ganze Sache nur ein einziges Mal funktioniert. Ob das wirklich nur am gescheitertem Zugriff auf den Telnetport liegt?

Tobias · 16 Mai 2014, 16:16:09

Teste mal mit unterschiedlichen Texten...

Gesendet von meinem ALCATEL ONE TOUCH 997D mit Tapatalk

Navigator · 17 Mai 2014, 15:47:35

So es klappt nun auch bei mir... der lokale Zugriff über Telnet war nicht möglich. Ich habe in der /hosts den Rechnernamen bei 127.0.0.1 entfernt und wieder localhost eingetragen. In der /hostname stand nach wie vor schon der richtige Rechnername. Telnet war als Paket auch noch nicht installiert, insoweit wohl irrelevant, der Dienst hat trotzdem schon gelauscht.

Danke für das prima Modul, wieder was zum "rumspielen".

Navigator · 21 Mai 2014, 16:27:11

Hier noch eine kleine Routine für die myUtils, damit beim Temperaturen vorlesen von Sensoren der Punkt gegen ein Komma getauscht wird und die Dame damit dann klar kommt.
Das war mein erstes selbst gebasteltes Script in Perl.

Ich weiss allerdings noch nicht wie sich das auf das Cacheverzeichnis auswirkt, der könnte sich damit schnell ins unermessliche füllen. Zum Glück sind die Dateien jedoch recht klein.

Code Auswählen


########Temperatur ohne Punkt mit Komma für TTS#######
sub
TemperaturenTTS
{
 my $Aussentempsensor=ReadingsVal("Aussentempsensor","temperature","");
 my $Punktlos=$Aussentempsensor;
 $Punktlos =~ s/\./,/;
 fhem ("set MyTTS tts Temperatur ist $Punktlos;")
 }

peterk_de · 22 Juni 2014, 23:54:12

Ich habe schon seit längerem folgende Fehlermeldung beim Starten von FHEM in der Konsole:

Code Auswählen


Prototype after '@' for main::Text2Speech_SplitString : @$$$$ at ./FHEM/98_Text2Speech.pm line 422, <$fh> line 1596.

Schaden scheint das aber keinen zu verursachen - läuft soweit ich erkennen kann alles prima - ist das bekannt? LG!

Tobias · 08 Juli 2014, 20:47:54

@peterk, warscheinlich muss die Routine nur weiter nach hinten in das Modul geschoben werden....

Schön aber sonst nix weiter zu hören... heißt das das Modul überall fehlerfrei arbeitet

Bei mir ist es so jedenfalls...

Rince · 09 Juli 2014, 06:08:34

Läuft 1a

Rince · 16 Juli 2014, 16:33:47

Weil es grade im Einsteigerforum ist:
Könntest du bitte noch zwei Sachen ändern:

Beim Einbinden einer MP3 muss Text vor und nach der MP3 kommen. Das ist nicht optimal. Ansonsten könnte man Stille vorher/nachher einfügen, oder auch ein Pling als Ankündigung einer Sprachausgabe.
Das wäre sehr hilfreich.

Und, zweite Frage (aber nicht so dringlich), das Mappen einer MP3 ist bei vielen MP3s umständlich. Ohne wäre es leichter. Einfach nur die MP3 in :: gesetzt z.B.
Dann wäre Text2Speech auch gleich gut geeignet zum MP3s abspielen. Ist bequemer als direkt den mplayer zu benutzen (non blocking...)
(Ich hätte gerne Fanfaren wenn ich mit dem Auto in den Hof fahre und das Haus betrete, möchte aber ungern im Regen stehen da fhem grade die Tür nicht öffnet, während die Fanfaren ertönen)

Dann könnte das Modul auch gleich als einfacher Audioplayer missbraucht werden.

kud · 16 Juli 2014, 16:38:16

Hallo Tobias,
danke für Dein sehr interessantes Modul.
Könntest Du oder ein anderer mir bitte folgendes kurz erklären.
TTS_CacheFileDir
Optional: Die per Google geladenen Sprachbausteine werden in diesem Verzeichnis zur Wiedeverwendung abgelegt. Es findet zurZEit keine automatisierte Löschung statt.
Warum muss ich irgendetwas cachen oder schaut es jedesmal nach ob schon mal "Die Temperatur im Wohnzimmer beträgt 20 Grad" gesagt wurde?

TTS_FileMapping
Angabe von möglichen MP3-Dateien mit deren Templatedefinition. Getrennt duch Leerzeichen. Die Templatedefinitionen können in den per tts übergebenen Sprachbausteinen verwendet werden und müssen mit einem beginnenden und endenden Doppelpunkt angegeben werden. Die Dateien müssen im Verzeichnis TTS_FIleTemplateDir gespeichert sein.
Auch das verstehe ich nicht. Kann ich nicht einfach eine MP3 mit
set MyTTS tts Horch was kommt von draußen rein :/Soundfiles/hollahi.mp3:
abspielen?
Das Mapping würde uUmständen mehrere Zeilen lang werden wenn ich 50 MP3s einbinden will.

Ich habe sicherlich noch kein Verständnis für die Arbeitsweise des Moduls. Bitte erklärt mir das.

Danke KU

Uups. Danke Rince. Du warst schneller.

Tobias · 16 Juli 2014, 19:04:50

Zitat
TTS_CacheFileDir
Optional: Die per Google geladenen Sprachbausteine werden in diesem Verzeichnis zur Wiedeverwendung abgelegt. Es findet zurZEit keine automatisierte Löschung statt.

Warum muss ich irgendetwas cachen oder schaut es jedesmal nach ob schon mal "Die Temperatur im Wohnzimmer beträgt 20 Grad" gesagt wurde?

Ganz einfach, Ziel ist eine flüssiger Sprachwiedergabe die so schnell als möglich nach Absetzen des Befehls einsetzt.
Das geht nur mit Vor-Cachen und Nutzung von "mp3wrap" um Teilsätze zu einem Gesamt-MP3 zusamenfügen zu können.
Vor jeder(!) Ausgabe wird geschaut, ob schon jeder Teilsatz im Cache vorhanden ist. Falls ein Teilsatz fehlt, wird dieser heruntergeladen. Das merkt man an einer gefühlt langen Sprechpause. Sind alle Teilsätze im Cache vorhanden, läuft die Sprachausgabe ohne Internetzugriff, ohne Sprechpause und damit flüssig.
Teilsätze bedeutet, das der duch fhem-übergebene TTS-String versucht wird, in einzel-Sätze zu zerlegen. Das passiert am Satzende (Punkt), und bei zusammengesetzten Sätzen (Komma, "und"). Das ist notwendig, weil die Google TTS-Engine nur maximal 100Zeichen akzeptiert. Wünde man diese einzelnen MP3´s hinterher nicht wieder zusammensetzen (-> mp3wrap) würde der sprachfluss extrem stockend sein. Erklär das mal deiner Frau warum die Tante zwischen jedem Teilsatz 3-4 Gedenksekunden einlegt

Zitat
TTS_FileMapping
Angabe von möglichen MP3-Dateien mit deren Templatedefinition. Getrennt duch Leerzeichen. Die Templatedefinitionen können in den per tts übergebenen Sprachbausteinen verwendet werden und müssen mit einem beginnenden und endenden Doppelpunkt angegeben werden. Die Dateien müssen im Verzeichnis TTS_FIleTemplateDir gespeichert sein.
Auch das verstehe ich nicht. Kann ich nicht einfach eine MP3 mit
set MyTTS tts Horch was kommt von draußen rein :/Soundfiles/hollahi.mp3:
abspielen?

Ist aufgenommen zur nächsten version.

kud · 17 Juli 2014, 12:42:24

Danke Tobias.
Ich wollte schon motzen wegen der (vormals) einsilbigen Erklärung.
Das würde bedeuten, wenn man Standardsätze geschickt aufsplittet das keine "Übersetzung" seitens Google mehr vorgenommen wird ?
Ich lass schon mal Teilsätze vorab mit
"set TTSwiedergabe tts Die Temperatur im"
"set TTSwiedergabe tts Wohnzimmer beträgt" "set TTSwiedergabe tts Kinderzimmer beträgt" etc.
"set TTSwiedergabe tts 18 Grad." "set TTSwiedergabe tts 19 Grad." etc.
im Cache ablegen.

In diesem Fall würde ein "set TTSwiedergabe tts Die Temperatur im, Wohnzimmer beträgt, 20 Grad."
keinen Googlezugriff benötigen ?

Sehe ich das Richtig?

Tobias · 18 Juli 2014, 09:15:37

Nein, nicht ganz... TTS kümmert sich selbständig um das Aufsplitten und cachen. Du musst nichts aktiv vorcachen. Außerdem bedeutet ein Komma auch immer eine Sprechpause....
Also einfach deinen TTS-Satz ins TTS-Modul werfen und gut iss...

Hier mal eine neue Version zum testen. Bitte um Rückmeldung ob soweit io. Dann checke ich sie ein.

- Man kann jetzt eine mp3-Datei direkt angeben, zusätzlich zu den vordefinierten Templates
- Man kann jetzt auch eine mp3 als alleiniges TTS übergeben

bei Angabe von mp3-Dateien müssen diese wie vorher unterhalb von TTS_CachefileDir/TTS_FileTemplateDir liegen. Default ist cache/templates
Wird eine angebene Datei nicht gefunden so spricht TTS den Dateipfad aus

Beispiele:
set MyText2Speech tts :klingel.mp3:
set MyText2Speech tts :music/Hardcore-Vibes.mp3:
set MyText2Speech tts :tischglocke-einmal.mp3:Das ist meine Tischglocke.
set MyText2Speech tts :tischglocke-einmal.mp3:Erdgeschoss alles geschlossen.:tischglocke-einmal.mp3:Obergeschoss alles geschlossen.

Bitte beachten, bei Nutzung von MP3WRAP ist die flüssige Sprachausgabe erst ab der 2. Wiederholung spürbar. Ist auch klar, da der Cache erst aufgebaut werden muss. Also im Test immer alles 2x sagen

Fast wie im richtigen Leben

Rince · 18 Juli 2014, 09:27:25

Werde es heute Abend ausprobieren.

Vielen Dank schonmal!

fiedel · 18 Juli 2014, 12:25:23

Hi Tobias,

wo du gerade dabei bist:

Mit meinen Passivlautsprechern ist es nach wie vor viel zu leise und ich patche mir nach jedem deiner Updates den Gain- Faktor wieder rein. Wenn du vielleicht auch meinst es könnte sinnvoll sein, könntest du es ggf. übernehmen? Im Anhang noch mal meine etwas ältere, gepatchte Version (Achtung: Das "set volume"- Kommando macht damit viel lauter, als in der Originalversion!!!)

Gruß und Dank

Frank

Tobias · 18 Juli 2014, 12:57:14

Hi. Reicht das originale Set volume nicht aus?? Auch nicht 200 oder 300%??

Gesendet von meinem ALCATEL ONE TOUCH 997D mit Tapatalk