Neues Modul: Text2Speech

Begonnen von Tobias, 07 Januar 2014, 12:57:23

Vorheriges Thema - Nächstes Thema

Navigator

Zitat von: Tobias am 26 Juni 2021, 19:36:11
Eventuel.... schreib mal welche Parameter genau....
Auf meiner verlinkten Seite weiter unten und kann man Pitch, Speed und Stimmenart einstellen zum testen. Wenn man dort ein wenig rumspielt kann man genau so eine besoffene Stimme, wie aktuell im TTS Modul benutzt wird erzeugen. Diese Parameter kann man ja sicherlich optional auch mit an die API übergeben.

TomLee

Hab mich bisher mit dem Modul kaum beschäftigt, Speed soll man mit dem Attribut TTS_Speed beeinflussen können, hat bei mir aber keine Auswirkungen iVm. sonos2mqtt, egal was man einstellt.

Ellert

Zitat von: Dittel am 27 Juni 2021, 11:33:02
... Diese Parameter kann man ja sicherlich optional auch mit an die API übergeben.
Du könntest es selbst mal versuchen und das Ergebnis hier präsentieren.

In Zeile 55 des Moduls kannst Du die Parameter ergänzen in der Form: &paramerter=Wert

Zeile 55: my %ttsAddon        = ("Google"     => "client=tw-ob&ie=UTF-8",

Navigator

Zitat von: Ellert am 28 Juni 2021, 07:14:55
Du könntest es selbst mal versuchen und das Ergebnis hier präsentieren.

In Zeile 55 des Moduls kannst Du die Parameter ergänzen in der Form: &paramerter=Wert

Zeile 55: my %ttsAddon        = ("Google"     => "client=tw-ob&ie=UTF-8",

Funktioniert leider gar nicht. Die API, die das Modul benutzt ist veraltet und wir auch gar nicht mehr offiziell unterstützt.

mumpitzstuff

Die wurde noch nie offiziell unterstützt, hat aber den Vorteil, das es ohne Account, Anmeldung, Keys oder Kreditkarten funktioniert. Bei dem Cloud Zeug, ist das nicht der Fall.

Tobias

Zitat von: Dittel am 30 Juni 2021, 18:35:15
Funktioniert leider gar nicht. Die API, die das Modul benutzt ist veraltet und wir auch gar nicht mehr offiziell unterstützt.

Welche API denn?
Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter


Tobias

Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

Navigator

Zitat von: Tobias am 14 Juli 2021, 15:40:49
Stand December 14, 2009 !!!!
Das Modul ist ja auch von 2013 und nach dieser Methodik holt es nun mal die Stimmen dort ab.

mumpitzstuff

Wo kann ich denn für Polly die Stimme wie z.B. Marlene oder Vicki angeben bzw. für Vicki die Engine von Standard auf Neural umschalten? Im .aws Folder gibt es eine config Datei, mit der ich ein wenig rum probiert habe, aber das scheint wohl keine Auswirkungen zu haben oder ich habe dort etwas falsch konfiguriert.

Tobias

Eigentlich garnicht da ich die Stimmen fest im Modul verankert habe.
Du müsstest am Anfang des Moduls mit den Parametern etwas herumspielen
Maintainer: Text2Speech, TrashCal, MediaList

Meine Projekte: https://github.com/tobiasfaust
* PumpControl v2: allround Bewässerungssteuerung mit ESP und FHEM
* Ein Modbus RS485 zu MQTT Gateway für SolarWechselrichter

mumpitzstuff

#1151
Ah okay. Dann schaue ich mir das mal an. Danke für den Hinweis. Meine Frau kommt inzwischen auf immer neue Ideen, was ich alles wegen der schlechten Ansagen machen soll. Angefangen von komplett abschalten bis: Nimm die Stimmen deiner Kinder auf und spiel das ab".

PS:

Der Code ist leider ein wenig falsch.

Original:
my $res = $polly->SynthesizeSpeech(
        VoiceId => $TTS_Language,
        Text => $text,
        TextType => $texttype,
        OutputFormat => 'mp3',
    );


Bei VoiceId muss aber Marlene oder Vicki drin stehen und nicht TTS_Language, das bei mir "Deutsch" enthält. Das ist eine ungültige VoiceId und vermutlich wird dann immer Vicki verwendet. Ich habe jetzt mal VoiceId auf 'Marlene' gesetzt und SampleRate auf "24000", das hört sich etwas besser an. Falls Vicki verwendet werden sollte, dann kann man hier auch noch den Engine Parameter auf "neural" vorgeben. Bei Marlene geht das aber leider nicht. Hier geht nur "standard".

https://metacpan.org/pod/Paws::Polly::SynthesizeSpeech

Prof. Dr. Peter Henning

Ich schlage vor, "neutral" zu verwenden, nicht "neural".

Ernst gemeinte Empfehlung: Das Modul "Babble" verwenden, mit aktiviertem Chatbot.

Da werden alle nciht erkannten Fragen protokolliert. und man kann die Dialoge richtig nutzerfreundlich gestalten.

Inklusive akustischer Menüführung.

LG

pah


mumpitzstuff

So dachte ich auch erst, aber es steht wirklich überall Neural und nicht Neutral.

https://docs.amazonaws.cn/en_us/polly/latest/dg/NTTS-main.html

Prof. Dr. Peter Henning

Aaah, sehr interessant - das ist natürlich etwas anderes. Hätte ich vorher recherchieren sollen, das ist ein wissenschaftlich hoch innovativer Ansatz.

LG

pah