Neues Modul: Text2Speech

Prof. Dr. Peter Henning · 25 April 2019, 10:49:32

ZitatFalls man wirklich einen festen Dateinamen benötigt sehe ich ein neues Attribut wo man einen Pfad mit Dateinamen angeben kann Diesen kann man nur setzen wenn mp3wrap aktiviert ist. Ist dieser gesetzt wird das EndErgebnis immer in diese Datei geschrieben und "lastfilename" angetriggert.

Klingt gut.

LG

pah

Prof. Dr. Peter Henning · 25 April 2019, 17:51:05

Ist eigentlich hier Off-Topic, die Anleitung dazu steht aber auf https://wiki.fhem.de/wiki/Text2Speech#Sprachausgabe_per_Bluetooth-Lautsprecher_unter_Raspbian_Jessie.

Ich habe das Problem, dass mein System immer wieder die manuell eingetragene

Code Auswählen

Class=0x20041C aus

Zitat/var/lib/bluetooth/XX:XX:XX:XX:XX:XX/settings

löscht.

Damit kriege ich zwar mein Bluetooth-Audiosystem gepairt, aber ein connect schlägt jedes Mal fehl.

Kennt sich jemand damit näher aus ?

LG

pah

mumpitzstuff · 25 April 2019, 20:42:46

Das steht bei mir auch nicht da drin.

Bei mir taucht das in:

Code Auswählen

sudo nano /etc/bluetooth/audio.conf

Code Auswählen

[General]
Enable=Source,Sink,Headset,Gateway,Control,Media,Socket
Class=0x20041C

und

Code Auswählen

sudo nano /etc/bluetooth/main.conf

Code Auswählen

[General]

Name = UD100
Class = 0x20041C

In der von dir erwähnten Datei steht:

Code Auswählen

[General]
Discoverable=false
DiscoverableTimeout=60
Alias=UD100

UD100 ist der von mir vergebene Name des Bluetooth Dongles.

Prof. Dr. Peter Henning · 25 April 2019, 20:54:38

OK, das ist ein Fehler im FhemWiki.

LG

pah

Tobias · 26 April 2019, 11:38:30

in meinem Repo steht die Testversion mit der verbesserten Umlautbehandlung (danke an pah!) zum test bereit. Bitte testet. ohne Test schiebe ich es nicht ins FHEM Repo
https://github.com/tobiasfaust/MyFHEM

Ich habe mal den Wetterbericht ausgeben lassen mit Google und mit Amazon-Polly. Ich dachte Google wär super, aber AmazonPolly ist Welten besser

Umlaute werden jetzt sowohl bei Google als auch bei AmazonPolly sauber ausgesprochen.

Ellert · 26 April 2019, 14:07:58

Ich habe die Version aus dem Repo für Google getestet.
Bisher hatte ich keine Probleme mit den Umlauten, diese Version lässt jetzt Sonderzeichen statt Umlaute sprechen, a1/4 statt ü.

Der Text von der Website soll UTF-8 kodiert sein.

Auch wenn ich in der Detailansicht "gemütliche Hühner" sagen lasse, werden die Sonderzeichen gesprochen, wie im Anhang zu hören.

Sehe ich das richtig, Amazon ist nach spätestens einem Jahr kostenpflichtig?

Tobias · 26 April 2019, 15:12:16

ich schau mir das an. Ich hatte genau den Testcase mit Google und Amazon getestet und es hat funktioniert....
Und Ja, Amazon ist kostenpflichtetig, ABER: https://aws.amazon.com/de/polly/pricing/

ZitatKostenloses Kontingent
5 Millionen Zeichen pro Monat
Das kostenlose Kontingent von Amazon Polly umfasst 5 Mio. Zeichen pro Monat für Sprach- oder Sprach-Metadaten-Anforderungen während der ersten 12 Monate ab Ihrer ersten Sprachanfrage.

ZitatNutzungsabhängiges Modell
Sie erhalten monatlich eine Rechnung über die Anzahl der verarbeiteten Textzeichen. Außerhalb des kostenlosen Kontingents werden für Amazon Polly für Sprach- oder Sprach-Metadaten-Anforderungen 4,00 USD pro 1 Millionen Zeichen berechnet.

1Mio Zeichen für 4$ bezeichne ich als so gut wie kostenlos

Ich hatte heute Zeit und habe heute das Attribut "TTS_OutputFile" hinzugefügt

ZitatTTS_OutputFile
Angabe eines fixen Dateinamens als mp3 Output. Das Attribut ist nur relevant in Verbindung mit TTS_UseMP3Wrap.
Wenn ein Dateinamen angegeben wird, so wird zusätzlich TTS_CacheFileDir beachtet. Bei einer absoluten Pfadangabe
muss der Dateipfad durch FHEM schreibbar sein.
<code>attr myTTS TTS_OutputFile output.mp3</code>
<code>attr myTTS TTS_OutputFile /media/miniDLNA/output.mp3</code>

Edit: Umlautproblem gefunden, irgendwie reagiert Google nicht auf die neue Codepage konvertierung von pah.
Explizit für Google habe ich die manuelle Umformung vor der Codepagekonvertierung wieder eingebaut.
Bei mir klappt es jetzt mit der neuesten Version.

Im Anhang auch der gesprochene Wetterbericht im Vergleich Google vs. Amazon

Prof. Dr. Peter Henning · 26 April 2019, 15:56:31

Mit dem Umlautkonverter geht das in alle Richtungen - man muss nur wissen, was geliefert wird und was erwartet wird.

ZitatAmazonPolly ist Welten besser

Sag ich ja - und nicht Amazon hats erfunden...

Dass hier zugekauft worden ist, erkennt man auch daran, dass die umgekehrte Richtung (also STT) nur mit dem doofen Umweg über Amazon S3 Buckets funktioniert - da ist Google voraus.

LG

pah

mumpitzstuff · 26 April 2019, 16:10:37

Code Auswählen

sudo -u fhem aws polly synthesize-speech --output-format mp3 --voice-id Marlene --text 'Das ist ein Test' test.mp3

Eine Datei test.mp3 wird zwar erzeugt (inhalt habe ich noch nicht abgespielt), aber der Fehler wird ebenfalls ausgegeben:

Code Auswählen

Unknown output type: mp3

Hat jemand eine Ahnung was ich falsch mache? Beim Aufruf von aws configure habe ich 'mp3' als default output format angegeben. Ist das falsch?

Tobias · 26 April 2019, 16:12:18

War auch mein Fehler
Beim aws configure musst du json als Output Format nehmen

Ich nutze im Modul aber nicht mehr die awscli

Gesendet von iPhone mit Tapatalk

mumpitzstuff · 26 April 2019, 16:19:22

Ah okay danke. Dann muss ich mal rein gucken was da jetzt verwendet wird.

Tobias · 26 April 2019, 16:20:43

Cpan Paws

Steht auch im TTS Wiki

Gesendet von iPhone mit Tapatalk

mumpitzstuff · 26 April 2019, 16:28:40

Amazon Polly kann übrigens "nur" 3000 Zeichen direkt verarbeiten. Alles darüber hinaus muss man irgendwie als Auftrag oder sowas ablegen. Hab ich irgendwo gelesen gehabt bei der Einrichtung.

Ellert · 26 April 2019, 16:30:04

Die Umlaute funktionieren jetzt auch bei mir wieder.

Ein bestehendes Problem bleibt die Trennung bei "und".

Ein Beispiel, hörbar im Anhang:
Ich habe keinen Grund zugehen aber Du gehst immer wieder grundlos oder ist es weil du rundlich bist oder was ist los mit dir und deinem Hund Marie

Edit:
Die Amazon Stimme haut mich jetzt nicht vom Hocker, sie spricht ziemlich schnell und hat kaum Modulation in Vergleich zu Google. Das ist auch die unvoreingenommene Einschätzung meiner Frau.

mumpitzstuff · 26 April 2019, 16:45:12

Im wiki sollte erwähnt werden, das credentials unter /opt/fhem/.aws/credentials abgelegt werden müssen, da diese ja für den fhem user und nicht pi oder irgendwas angelegt werden müssen.