Sonos Speak: natürliche Sprachausgabe

Begonnen von BruderBleistift, 23 Februar 2018, 10:02:56

Vorheriges Thema - Nächstes Thema

BruderBleistift

Hallo zusammen,

ich habe das Sonos Modul und Sonos Speak erfolgreich bei mir implementiert.
Vor 10 Jahren hätte mich die Sprachausgabe von Sonos Speak auch sehr begeistert, aber in Zeiten von Alexa, Siri und Co. ruft die Sprachausgabe des Google-Übersetzers, welcher Standardmäßig hinterlegt ist keine große Begeisterung hervor.

Gibt es hierfür die Möglichkeit eine natürlichere Sprachausgabe zu definieren?
Eventuell würde es auch schon helfen, die aktuelle Sprachausgabe etwas zu beschleunigen.

Im Forum und Google bin ich leider nicht fündig geworden. Entweder es gibt keine, oder mir fehlen die richtigen Suchskills.

Vielen Dank schon einmal im Voraus.

Gruß
Paule

Elektrolurch

Die offline - Module klingen alle noch schlimmer. Es gibt noch einen online - Dienst: VoiceRSS, den kannst Du auf deren Webseite testen und über das Modul einbinden. Aber ich finde den auch nicht besser, als google.
Ansonsten: Für statische Texte ein Mico nehmen und den Text als mp3 (von netter Freundin vorgelesen :-)) aufnehmen.

Elektrolurch
configDB und Windows befreite Zone!

Lorenz

Ich habe die nette Freundin weggelassen und das mit den Bordmitteln von OS X gelöst und Texte zu mp3 gewandelt. Ich finde das Ergebnis ganz ordentlich und über Sonos als Ansage im Haus durchaus verständlich. Hier mal ein Beispiel...

LG
. . . . . .
Fhem auf NUC7i3BNH, Raspberry Pi B und B+, Raspberry Pi 2 B, Peripherie: FB7490, 1-Wire, Homematic, FS20, Lampen, Briefkasten, Klingel, Sonos, GardenaSmart, Unifi, Gaszähler an GPIO, Stromzähler EFR SGM-C4, Heizung Buderus GBH 172, Alarmanlage EMA und BMA von Bosch

BruderBleistift

#3
Zitat von: Lorenz am 23 Februar 2018, 13:59:09
.. und das mit den Bordmitteln von OS X gelöst und Texte zu mp3 gewandelt.

Das klingt zwar leider immer noch nicht so natürlich, wie z.B. Alexa, aber doch schon besser als der Googletranslator.

Könntest du das mit den OS X Bordmitteln bitte etwas näher beschreiben?
Wahrscheinlich mit dem VoiceOver-Dienstprogramm, aber irgendwie steige ich da nicht so ganz durch.

edit: Ich bin eben über Amazon Polly gestolpert --> https://docs.aws.amazon.com/de_de/polly/latest/dg/how-text-to-speech-works.html
Hier gibt es drei Stimmen zur Auswahl. Zwei Frauen- und eine Männerstimme. Ich finde die Männerstimme klingt schon ganz gut.

Beispiel angehängt.

Lorenz

Bei OS X kann man das über die Konsole mit dem say Kommando machen und dann nach mp3 konvertieren. Ist aber etwas aufwändig zu bedienen, einfacher wird es mit einer Hilfs-App wie Text2Speech oder besser say it save it (danach googeln, ist mein Favorit). Für eine brauchbare Stimme habe ich die Systemstimme Anna durch den Download der besseren Sprachfiles von Apple verbessert. Ein Problem waren noch Pausen im Text, aber die kann man durch Einfügen von z.B. [[slnc 1000]] einfügen, Zahl = millisek.

LG
. . . . . .
Fhem auf NUC7i3BNH, Raspberry Pi B und B+, Raspberry Pi 2 B, Peripherie: FB7490, 1-Wire, Homematic, FS20, Lampen, Briefkasten, Klingel, Sonos, GardenaSmart, Unifi, Gaszähler an GPIO, Stromzähler EFR SGM-C4, Heizung Buderus GBH 172, Alarmanlage EMA und BMA von Bosch

Elektrolurch

Hallo,

Zitat:
edit: Ich bin eben über Amazon Polly gestolpert --> https://docs.aws.amazon.com/de_de/polly/latest/dg/how-text-to-speech-works.html
Hier gibt es drei Stimmen zur Auswahl. Zwei Frauen- und eine Männerstimme. Ich finde die Männerstimme klingt schon ganz gut.

Ja, die männliche Stimme klingt tatsächlich ganz ok.  Bevor (und meine Zeit ist im Augenblick recht knapp), ich mich in die API da einlese...
hat das schon jemand für das Text2Speech - Modul von fhem zugänglich gemacht?
Wäre schön, dann hier mal die Konfig dafür zu posten.

Elektrolurch
configDB und Windows befreite Zone!

fiedel

Meine Lieblingsstimme ist "Gudrun". Im Onlinefenster kann man kostenfrei aus Texten MP3s erzeugen.
FeatureLevel: 6.1 auf Wyse N03D ; Deb. 11 ; Perl: v5.14.2 ; IO: HM-MOD-RPI-PCB + VCCU|CUL 868 V 1.66|LinkUSBi |TEK603
HM: SEC-SCO|SCI-3-FM|LC-SW4-PCB|ES-PMSW1-PL|RC-4-2|SEN-MDIR-O|SEC-WDS-2
CUL: HMS100TF|FS20 S4A-2 ; OWDevice: DS18S20|DS2401|DS2406|DS2423

Shojo

FHEM auf: Shuttle PC (x64) (Docker)
Bridge: SignalESP 433mHz, ConBee (deCONZ in Docker)
Rest: ESP8266, SONOFF, Sonos, Echo Dot, Xiaomi Vacuum (root), ESP RGBWW Wifi Led Controller, Node-RED, LEDMatrix, Pixel It

fiedel

Ja klingt schön natürlich und vor Allem schön deutlich und verständlich.
Beim Gedichte rezitieren entwickelt sie sogar Pathos und gute Betonung.

Bitte mal den ultimativen Testtext eingeben:

ZitatDer Biber sprach zur Beutelratte:
"Gestatten, dass ich Sie begatte?"
"Nein!" sprach da die Beutelratte.
"Denn oben auf der Felsenplatte
sitzt mein Beutelrattengatte
Und hat selber Latte."
;D
FeatureLevel: 6.1 auf Wyse N03D ; Deb. 11 ; Perl: v5.14.2 ; IO: HM-MOD-RPI-PCB + VCCU|CUL 868 V 1.66|LinkUSBi |TEK603
HM: SEC-SCO|SCI-3-FM|LC-SW4-PCB|ES-PMSW1-PL|RC-4-2|SEN-MDIR-O|SEC-WDS-2
CUL: HMS100TF|FS20 S4A-2 ; OWDevice: DS18S20|DS2401|DS2406|DS2423