Neues Modul: Text2Speech

Begonnen von Tobias, 07 Januar 2014, 12:57:23

Vorheriges Thema - Nächstes Thema

Prof. Dr. Peter Henning

ZitatFalls man wirklich einen festen Dateinamen benötigt sehe ich ein neues Attribut wo man einen Pfad mit Dateinamen angeben kann Diesen kann man nur setzen wenn mp3wrap aktiviert ist. Ist dieser gesetzt wird das EndErgebnis immer in diese Datei geschrieben und "lastfilename" angetriggert.
Klingt gut.

LG

pah

Prof. Dr. Peter Henning

Ist eigentlich hier Off-Topic, die Anleitung dazu steht aber auf https://wiki.fhem.de/wiki/Text2Speech#Sprachausgabe_per_Bluetooth-Lautsprecher_unter_Raspbian_Jessie.

Ich habe das Problem, dass mein System immer wieder die manuell eingetragene  Class=0x20041C aus
Zitat/var/lib/bluetooth/XX:XX:XX:XX:XX:XX/settings
löscht.

Damit kriege ich zwar mein Bluetooth-Audiosystem gepairt, aber ein connect schlägt jedes Mal fehl.

Kennt sich jemand damit näher aus ?

LG

pah

mumpitzstuff

Das steht bei mir auch nicht da drin.

Bei mir taucht das in:

sudo nano /etc/bluetooth/audio.conf

[General]
Enable=Source,Sink,Headset,Gateway,Control,Media,Socket
Class=0x20041C


und

sudo nano /etc/bluetooth/main.conf

[General]

Name = UD100
Class = 0x20041C


In der von dir erwähnten Datei steht:

[General]
Discoverable=false
DiscoverableTimeout=60
Alias=UD100


UD100 ist der von mir vergebene Name des Bluetooth Dongles.

Prof. Dr. Peter Henning

OK, das ist ein Fehler im FhemWiki.

LG

pah

Tobias

in meinem Repo steht die Testversion mit der verbesserten Umlautbehandlung (danke an pah!) zum test bereit. Bitte testet. ohne Test schiebe ich es nicht ins FHEM Repo
https://github.com/tobiasfaust/MyFHEM

Ich habe mal den Wetterbericht ausgeben lassen mit Google und mit Amazon-Polly. Ich dachte Google wär super, aber AmazonPolly ist Welten besser :)
Umlaute werden jetzt sowohl bei Google als auch bei AmazonPolly sauber ausgesprochen.
Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

Ellert

#980
Ich habe die Version aus dem Repo für Google getestet.
Bisher hatte ich keine Probleme mit den Umlauten, diese Version lässt jetzt Sonderzeichen statt Umlaute sprechen, a1/4 statt ü.

Der Text von der Website soll UTF-8 kodiert sein.

Auch wenn ich in der Detailansicht "gemütliche Hühner" sagen lasse, werden die Sonderzeichen gesprochen, wie im Anhang zu hören.

Sehe ich das richtig, Amazon ist nach spätestens einem Jahr kostenpflichtig?

Tobias

#981
ich schau mir das an. Ich hatte genau den Testcase mit Google und Amazon getestet und es hat funktioniert....
Und Ja, Amazon ist kostenpflichtetig, ABER: https://aws.amazon.com/de/polly/pricing/
ZitatKostenloses Kontingent
5 Millionen Zeichen pro Monat
Das kostenlose Kontingent von Amazon Polly umfasst 5 Mio. Zeichen pro Monat für Sprach- oder Sprach-Metadaten-Anforderungen während der ersten 12 Monate ab Ihrer ersten Sprachanfrage.
ZitatNutzungsabhängiges Modell
Sie erhalten monatlich eine Rechnung über die Anzahl der verarbeiteten Textzeichen. Außerhalb des kostenlosen Kontingents werden für Amazon Polly für Sprach- oder Sprach-Metadaten-Anforderungen 4,00 USD pro 1 Millionen Zeichen berechnet.
1Mio Zeichen für 4$ bezeichne ich als so gut wie kostenlos

Ich hatte heute Zeit und habe heute das Attribut "TTS_OutputFile" hinzugefügt
ZitatTTS_OutputFile
      Angabe eines fixen Dateinamens als mp3 Output. Das Attribut ist nur relevant in Verbindung mit TTS_UseMP3Wrap.
      Wenn ein Dateinamen angegeben wird, so wird zusätzlich TTS_CacheFileDir beachtet. Bei einer absoluten Pfadangabe
      muss der Dateipfad durch FHEM schreibbar sein.
      <code>attr myTTS TTS_OutputFile output.mp3</code>
      <code>attr myTTS TTS_OutputFile /media/miniDLNA/output.mp3</code>

Edit: Umlautproblem gefunden, irgendwie reagiert Google nicht auf die neue Codepage konvertierung von pah.
Explizit für Google habe ich die manuelle Umformung vor der Codepagekonvertierung wieder eingebaut.
Bei mir klappt es jetzt mit der neuesten Version.

Im Anhang auch der gesprochene Wetterbericht im Vergleich Google vs. Amazon
Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

Prof. Dr. Peter Henning

Mit dem Umlautkonverter geht das in alle Richtungen - man muss nur wissen, was geliefert wird und was erwartet wird.
ZitatAmazonPolly ist Welten besser
Sag ich ja - und nicht Amazon hats erfunden...

Dass hier zugekauft worden ist, erkennt man auch daran, dass die umgekehrte Richtung (also STT) nur mit dem doofen Umweg über Amazon S3 Buckets funktioniert - da ist Google voraus.

LG

pah

mumpitzstuff

sudo -u fhem aws polly synthesize-speech --output-format mp3 --voice-id Marlene --text 'Das ist ein Test' test.mp3

Eine Datei test.mp3 wird zwar erzeugt (inhalt habe ich noch nicht abgespielt), aber der Fehler wird ebenfalls ausgegeben:

Unknown output type: mp3

Hat jemand eine Ahnung was ich falsch mache? Beim Aufruf von aws configure habe ich 'mp3' als default output format angegeben. Ist das falsch?

Tobias

War auch mein Fehler
Beim aws configure musst du json als Output Format nehmen

Ich nutze im Modul aber nicht mehr die awscli


Gesendet von iPhone mit Tapatalk
Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

mumpitzstuff

Ah okay danke. Dann muss ich mal rein gucken was da jetzt verwendet wird.

Tobias

Cpan Paws

Steht auch im TTS Wiki :)


Gesendet von iPhone mit Tapatalk
Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

mumpitzstuff

Amazon Polly kann übrigens "nur" 3000 Zeichen direkt verarbeiten. Alles darüber hinaus muss man irgendwie als Auftrag oder sowas ablegen. Hab ich irgendwo gelesen gehabt bei der Einrichtung.

Ellert

#988
Die Umlaute funktionieren jetzt auch bei mir wieder.

Ein bestehendes Problem bleibt die Trennung bei "und".

Ein Beispiel, hörbar im Anhang:
Ich habe keinen Grund zugehen aber Du gehst immer wieder grundlos oder ist es weil du rundlich bist oder was ist los mit dir und deinem Hund Marie

Edit:
Die Amazon Stimme haut mich jetzt nicht vom Hocker, sie spricht ziemlich schnell und hat kaum Modulation in Vergleich zu Google. Das ist auch die unvoreingenommene Einschätzung meiner Frau.

mumpitzstuff

Im wiki sollte erwähnt werden, das credentials unter /opt/fhem/.aws/credentials abgelegt werden müssen, da diese ja für den fhem user und nicht pi oder irgendwas angelegt werden müssen.