google text2speech blockiert

Begonnen von justme1968, 30 Juli 2015, 01:25:28

Vorheriges Thema - Nächstes Thema

justme1968

ich habe seit ein paar tagen das problem das tts mit google nur noch nach captcha eingabe funktioniert und somit die sprachausgabe auf meinem sonos system nicht mehr funktioniert. ich vermute das text2speech modul hat das gleiche problem.

das ganze betrifft nicht nur meinen anschluss sondern mindestens noch zwei weitere bei kabelbw. ich vermute das noch mehr betroffen sind. abgesehen davon hat mich die abhängigkeit von google dabei schon länger gestört.

nach einiger suche und probieren der für linux erhältlichen freien offline systeme wie festival, mbrola, espeak und anderen war die enttäuschung ziemlich gross da kein vernünftiges deutsches system dabei ist. die für festival früher scheinbar erhältlichen deutschen stimmen gibt es nicht mehr, eine spezielle deutsche festival version habe ich nicht zum laufen bekommen.

nach weiterem suchen bin ich dann auf cepstral gestossen. das ist ein kommerzielles system das die personal use variante auch für linux anbietet und auch zwei deutsche stimmen im programm hat. das ganze kostet 35$ pro stimme und funktioniert erstaunlich gut. diese version muss man zwar ein malig beim support anfragen aber die installation war danach völlig problemlos und funktioniert sogar auf meiner synology ds1812.

die stimmen lassen sich in tonhöhe und geschwindigkeit variieren und es gibt ein paar effekte. z.b. ein blecherner roboter den ich für ganz gelungen halte.

vielleicht hilft es ja noch anderen.

gruss
  andre
hue, tradfri, alexa-fhem, homebridge-fhem, LightScene, readingsGroup, ...

https://github.com/sponsors/justme-1968

hexenmeister

Danke für die Info. Eine offline sprachausgabe wäre schon schön. cepstral scheint interessant zu sein, auch wenn mit 35 $ leider nicht ganz günstig :(
Jetzt noch eine gute Spracherkennung...
Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Otto123

Zitatich habe seit ein paar tagen das problem das tts mit google nur noch nach captcha eingabe funktioniert und somit die sprachausgabe auf meinem sonos system nicht mehr funktioniert. ich vermute das text2speech modul hat das gleiche problem
Wobei das Problem mit Google lösbar ist http://forum.fhem.de/index.php/topic,18481.msg317208.html#msg317208

Danke für die Info! :)

Gruß Otto
Viele Grüße aus Leipzig  ⇉  nächster Stammtisch an der Lindennaundorfer Mühle
RaspberryPi B B+ B2 B3 B3+ ZeroW,HMLAN,HMUART,Homematic,Fritz!Box 7590,WRT3200ACS-OpenWrt,Sonos,VU+,Arduino nano,ESP8266,MQTT,Zigbee,deconz

hexenmeister

Zitat von: Otto123 am 30 Juli 2015, 13:12:49
Wobei das Problem mit Google lösbar ist
Die Frage ist: Wie lange? Wenn Google keine Lust mehr hat... :(
Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

ChrisK

Zitat von: hexenmeister am 30 Juli 2015, 14:16:20
Die Frage ist: Wie lange? Wenn Google keine Lust mehr hat... :(
Das ist eine sehr gute Frage!

Google hat in den meisten Fällen eine relativ offene URL-Struktur, die man genau wie hier gut einsetzen kann. In der Regel kommt die Captcha-Abfrage erst wenn man sehr viele Abfragen von der gleichen IP gestartet hat.
In diesem Fall haben die einfach nur ein paar Parameter dazu gepackt. "Geschützt" haben die ihren Dienst dadurch aber nicht. Solche Code-Anpassungen machen die relativ häufig.
Die nutzen ja diesen Dienst (tts) selber auch auf translate.google.com. D.h. theoretisch kann man da immer gucken, wie die url zusammengesetzt wird und die nachbilden.

Sehr selten kann es aber auch passieren, dass zusätzlich noch eine ID (dann auf translate.google.com) generiert wird und diese mit übergeben wird, so dass die mp3 nur dann zurückkommt, wenn es vorher einen Aufruf von translate.google.com gab. Das könnte man zwar auch simulieren, wenn man aber an dem Punkt ist, merkt man dass Google was dagegen hat und man sollte sich nicht zu sehr auf diese Spielchen einlassen. Am Ende wird man merken, wer mehr Ressourcen im Handgepäck hat ;)

Deswegen denke ich auch, dass eine Alternative sehr sinnvoll ist.

Wäre nur interessant, wie viele fhem-User dafür auch bezahlen würden.
Es ist ja leider so, dass der Geldbeutel bei Hardware schnell geöffnet wird (wenn man so sieht, was der eine oder andere an Komponenten hat), bei Software ist dann aber schnell Ende mit Bezahlen. "Es gibt doch die kostenlose Google-Alternative" ;)
Ich würde für so etwas prinzipiell bezahlen, wenn ich es sinnvoll einsetzen würde. Aktuell hatte ich aber das text2speech Modul nur installiert, meine Frau und mich ein paar Mal erschrocken, als es aus den Mini-Boxen hieß "Die Rollos werden jetzt runter gefahren" und es dann wieder deaktiviert ;)

Otto123

Zitat von: ChrisK am 30 Juli 2015, 15:08:16
Ich würde für so etwas prinzipiell bezahlen, wenn ich es sinnvoll einsetzen würde. Aktuell hatte ich aber das text2speech Modul nur installiert, meine Frau und mich ein paar Mal erschrocken, als es aus den Mini-Boxen hieß "Die Rollos werden jetzt runter gefahren"
Ja, ich verwende es auch nur zum Spass. Ich finde es lustig wenn sie mir früh sagt wie warm es draußen ist... Ob man das braucht?!
Ich sehe es genau wie Du: ich würde bezahlen wenn ich es wirklich sinnvoll einsetzen würde.

Ich habe auch ein ungutes Gefühl, dass für FHEM keiner Geld will. Aber ich hoffe ich gebe der Gemeinschaft durch Mitarbeit im Forum ein klein wenig zurück und spende martin ab und an einen Beitrag damit die Infrastruktur dafür überhaupt existiert.

Gruß Otto
Viele Grüße aus Leipzig  ⇉  nächster Stammtisch an der Lindennaundorfer Mühle
RaspberryPi B B+ B2 B3 B3+ ZeroW,HMLAN,HMUART,Homematic,Fritz!Box 7590,WRT3200ACS-OpenWrt,Sonos,VU+,Arduino nano,ESP8266,MQTT,Zigbee,deconz

hexenmeister

Ich habe in der Wand festinstallierte Lautsprecher und nutze die Sprachausgabe durchaus sinnvoll (Warnungen über geöffnete Fenster, vor allem beim Verlassen des Hauses etc.). Ich wäre auch bereit etwas für die Sprachausgabe zu zahlen, auch wenn 35$ PRO STIMME mir etwas viel erscheint. Allerdings haben mich cepstral Demos nicht wirklich überzeugt. Die Mathias stimme war ok, ich hätte aber lieber eine Frauenstimme. Die Kathrin war jedoch nicht in der Lage vernünftig "19 Grad" auszusprechen. 'Old Robot'-Effekt war interessant, allerdings ist das auch der einzige gelungene (IMHO).
Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy

Otto123

Zitat von: hexenmeister am 30 Juli 2015, 20:48:04
ich hätte aber lieber eine Frauenstimme. Die Kathrin war jedoch nicht in der Lage vernünftig "19 Grad" auszusprechen.
Ja da bin ich Deiner Meinung, die Google Stimme finde ich besser. Obwohl man auch da manchmal tricksen muss um die Ausprache zu verbessern. z.B. : doppel n statt einfachen n bringt manchmal eine natürlichere Betonung.

Gruß Otto
Viele Grüße aus Leipzig  ⇉  nächster Stammtisch an der Lindennaundorfer Mühle
RaspberryPi B B+ B2 B3 B3+ ZeroW,HMLAN,HMUART,Homematic,Fritz!Box 7590,WRT3200ACS-OpenWrt,Sonos,VU+,Arduino nano,ESP8266,MQTT,Zigbee,deconz

fiedel

Meine Lieblingsstimme ist die Gudrun von diesem Anbieter. Kostet sogar fast 40 EUR, ist es aber definitiv auch wert. Leider gibt es die nur für Win oder Mac. Ich überlege schon, ob ich das gute alte WINE nehme, um die Windows- Stimme zu verwenden. Google nervt wirklich komplett! Die machen ständig gute Sachen, um sie kurz darauf wieder verschwinden zu lassen. Dieses "hinter dem Wurstzipfel herhecheln" macht keinen Spaß mehr... >:(
FeatureLevel: 6.1 auf Wyse N03D ; Deb. 11 ; Perl: v5.14.2 ; IO: HM-MOD-RPI-PCB + VCCU|CUL 868 V 1.66|LinkUSBi |TEK603
HM: SEC-SCO|SCI-3-FM|LC-SW4-PCB|ES-PMSW1-PL|RC-4-2|SEN-MDIR-O|SEC-WDS-2
CUL: HMS100TF|FS20 S4A-2 ; OWDevice: DS18S20|DS2401|DS2406|DS2423

Toto1973

Hallo!
Auch ich nutze die ganze Zeit Text2Speech. Gibt es da jetzt eine gute Alternative?
Und gibt es eine darauf angepasste TEXT2Speech Version?
Raspberry PI2, Rademacher DuoFern Stick, CUL, 2 x SCC,  JeeLink 868 Mhz, JeeLink 433 Mhz, 3x Magic UFO LED WiFi Controller, 4x MAX BC-RT-TRX-CyG, 2x MAX Fensterkontakt, 5x Rademacher Gurtwickler, 6x TX29DTH-it, 2x TX25-it als Helligkeitssensor, 1X HM-ES-PM, 6x Sonoff, 7x G-Homa, PIR-1000

Hollo

Ich finde diese "Ansagen" echt praktisch, weil ich dann nicht zwingend im passenden Moment (oder regelmäßig) auf irgendein Display gucken muss, und trotzdem zeitnah über wichtige Dinge informiert werde.

Daher habe ich das in mein Audiosystem eingebunden.
Dementsprechend würde ich das auch gerne weiter nutzen; in einer "zukunftssicheren Form".

Google hat das auch als kostenpflichtigen Dienst (20$ pro 1Million Streams oder sowas),
andere Dienstleister bieten sicherlich Ähnliches an.

Eine Form mit offline-Paket in passender Qualität wäre natürlich optimal; dann hätte man keine Probleme mit Latenzzeiten oder fehlender Verbindung.

FHEM 6.x auf RPi 3B Buster
Protokolle: Homematic, Z-Wave, MQTT, Modbus
Temp/Feuchte: JeeLink-Clone und LGW mit LaCrosse/IT
sonstiges: Linux-Server, Dreambox, "RSS-Tablet"

justme1968

#11
es gibt (zumindest unter linux) keine vernünftigen freuen text2speech systeme. ein bezahlbares system das ich für linux gefunden habe ist hier beschrieben: http://forum.fhem.de/index.php/topic,39570.msg317707.html#msg317707.

nicht ganz so gut wie google aber mit etwas fein tuning nicht schlecht.

gruss
  andre
hue, tradfri, alexa-fhem, homebridge-fhem, LightScene, readingsGroup, ...

https://github.com/sponsors/justme-1968

Hollo

@fiedel
Bei denen scheint es auch einen "Cloud-Service" zu geben.
Nach Registrierung hat man 10000 Zeichen pro Monat frei; das könnte mit dem Cachen doch gut reichen.
Für den eigenen TTS-Server habe ich keine Preise gefunden und den Wissenschaftszuang bekommen wir wohl auch nicht.

@justme1968
Kannst Du bitte den Link nochmal checken.
FHEM 6.x auf RPi 3B Buster
Protokolle: Homematic, Z-Wave, MQTT, Modbus
Temp/Feuchte: JeeLink-Clone und LGW mit LaCrosse/IT
sonstiges: Linux-Server, Dreambox, "RSS-Tablet"

Rince

http://mary.dfki.de
Braucht Java, aber das gibts unter Linux ja auch :)


Abseits davon:
Besonders spannend finde ich ja Dinge wie "emotional speech". Mit smileys und markern die "Stimmung" der Stimme zu ändern...

Fröhlich, traurig...
Wer zu meinen Posts eine Frage schreibt und auf eine Antwort wartet, ist hiermit herzlich eingeladen mich per PN darauf aufmerksam zu machen. (Bitte mit Link zum betreffenden Thread)

hexenmeister

Zitat von: Rince am 05 August 2015, 13:01:38
http://mary.dfki.de
Danke für den Link, habe etwas mit den Effekten rumgespielt, man ganz ordentliche Ausgabe bekommen, sehr cool! Jetzt muss ich mal ausprobieren, ob das vernünftig au dem CubieTruck läuft.

Könnte eine echte Alternative sein.
Maintainer: MQTT_GENERIC_BRIDGE, SYSMON, SMARTMON, systemd_watchdog, MQTT, MQTT_DEVICE, MQTT_BRIDGE
Contrib: dev_proxy