[Gelöst] Text2Speech Problem

pi-user · 08 Juni 2017, 20:33:41

Ich bin total verzweifelt!

Es kommt kein Ton raus. Das liegt bestimmt an die mp3 Dateien von googlen oder?

pi-user · 08 Juni 2017, 20:42:20

Ich habe gerade die mp3 Dateien von google unter Windows getestet und sie können abgespielt werden. Es sieht so aus, dass die Soundkarte HiFiBerry Amp+ diese Dateien nicht abspielen kann! Das gibt's doch gar nicht!?!?!

KernSani · 08 Juni 2017, 22:39:14

Hi,

eine kurze Google Recherche sagt mir, dass Hifiberry mit den niedrigen Sample-Raten nicht umgehen kann. Die Lösung scheint zu sein, die Dateien zu resamplen... http://forum.iobroker.net/viewtopic.php?t=2173#p51681. Für MPD gibt's auch ein FHEM-Modul, vielleicht musst du es damit versuchen...

Hollo · 08 Juni 2017, 23:19:41

Hmm, gut und schlecht zugleich, dass hier zu lesen.
Das ist ja eine weitere "Hürde", über die ich vermutlich gestolpert wäre bzw. noch werde,
wenn ich endlich alle "Audio-Ausgaben" (FHEM, MPD, Alexa, ?) auf einen Raspi bekommen will.

Otto123 · 08 Juni 2017, 23:40:38

Zitat von: pi-user am 08 Juni 2017, 20:42:20
Ich habe gerade die mp3 Dateien von google unter Windows getestet und sie können abgespielt werden. Es sieht so aus, dass die Soundkarte HiFiBerry Amp+ diese Dateien nicht abspielen kann! Das gibt's doch gar nicht!?!?!

Hatten ja andere schon festgestellt. An der simplen Klinke geht alles. Der Hifi Anschluss will eben nur Hifi und keinen schnöden Sound.

Ich habe da auch keine weitere Idee...

Gruß Otto

pi-user · 09 Juni 2017, 11:08:20

Da habt ihr Recht. Ich habe die gleiche Antwort von HiFiBerry Team bekommen:
--------------------
Hi,

the file that you're trying to play back used a sample rate of 24kHz. This isn't supported by the Amp+. Note that with this sample rate, the sound quality will be quite bad as the frequency response will be limited to less than 12kHz, which isn't high quality audio.

You can convert the MP3 to a higher sample rate, but the sound quality of the file still won't be very good.
--------------------

Ich habe eine andere Idee. Was haltet ihr davon, wenn ich die mp3 Datei (24kHz) von Google an einen Bluetooth Lautsprecher zum Abspielen sende? Wird es funktionieren? Ich muss nur herausfinden, wie man MyTTS unter fhem auf Bluetooth Lautsprecher umstellen kann!?!

pi-user · 09 Juni 2017, 11:28:52

Kann man Text2Speech mit einem anderen Anbieter im Internet verwenden oder ist Text2Speech fest mit Google verdrahtet. Eine lokale Lösung wäre auch sehr gut, aber wo gibt es eine kostenlose Framework für Raspberry Pi?

Wzut · 09 Juni 2017, 11:48:34

Zitat von: pi-user am 09 Juni 2017, 11:08:20
You can convert the MP3 to a higher sample rate

Ich würde an deiner Stelle mal Tobias den Maintainer von T2S anschreiben und ihn auf das Problem aufmerksam machen.
Vllt. ist er ja gewillt eine Unterstützung für sox einzubauen und die Google MP3 Datei vor der Ausgabe damit zu konvertieren.

Hollo · 09 Juni 2017, 12:46:47

Zitat von: pi-user am 09 Juni 2017, 11:28:52
Kann man Text2Speech mit einem anderen Anbieter im Internet verwenden oder ist Text2Speech fest mit Google verdrahtet. ...

Ja, geht auch mit anderen und da (z.B. VoiceRSS) kann man auch die Qualität vorgeben.
Dein Suchwort ist Text2Speech bzw. so ungefähr hier...https://forum.fhem.de/index.php/topic,18481.msg325724.html#msg325724 .

pi-user · 09 Juni 2017, 13:35:17

Hallo Hollo,

auf Deinem Bild sieht man eine Dropdownliste. Wie hast Du es so hinbekommen, dass man den Anbieter wechseln kann? Danke.

pi-user · 09 Juni 2017, 14:36:34

Ich finde irgendwie keine Infos darüber, wie man VoiceRSS in fhem einbinden und anschließend verwenden kann!

1. Wie kann VoiceRSS in fhem hinzufügen?
2. Wie sieht der Befehl von VoiceRSS unter fhem aus, um den Text als Sprache auszugeben?

Danke.

pi-user · 09 Juni 2017, 14:45:24

Ich habe TTS_Ressource auf VoiceRSS gesetzt und natürlich den TTS_APIKey. Ich gehe nun davon aus, dass durch TTS_Ressource nicht mehr Google verwendet wird oder?

FranzB94 · 09 Juni 2017, 19:38:13

Hi pi-user!

Schön, dass du das Attribut TTS_Resssource nun gefunden hast. In dem Bild fällt mir noch auf, dass du TTS_FileTemplateDir auch nicht gesetzt hast.
Ich hatte mir bei der Einrichtung den Hinweis notiert: Um mp3-Dateien direkt auszugeben, müssen diese mit führenden
und schließenden Doppelpunkten angegebenen sein.
Die MP3-Dateien müssen unterhalb des Verzeichnisses TTS_FileTemplateDir gespeichert sein.

Gruß Franz

pi-user · 09 Juni 2017, 21:07:44

Hallo Franz,

zuerst danke für den Hinweis, aber ich habe keine eigene MP3 Dateien. VoiceRSS speichert die doch unter cache!

Mit VoiceRSS kommt auch kein Ton aus dem Lautsprecher raus!?! Schrecklich!

Logdatei:

Code Auswählen

2017.06.09 21:02:12 4: MyTTS: Auflistung der Textbausteine nach Aufbereitung:
2017.06.09 21:02:12 4: MyTTS: 0 => Hallo
2017.06.09 21:02:12 4: Verwende TTS Spracheinstellung: Deutsch
2017.06.09 21:02:12 4: Text2Speech: Textbaustein ist keine direkte MP3 Datei, ermittle MD5 CacheNamen: b2b0061ae8da22eb45bdd7b2d8b41946.mp3
2017.06.09 21:02:12 4: Text2Speech: Verwende VoiceRSS OnlineResource zum Download
2017.06.09 21:02:12 4: Text2Speech: Hole URL: http://api.voicerss.org/?hl=de-de&key=<Mein API-Key>&f=&r=&src=Hallo
2017.06.09 21:02:12 4: Text2Speech: Schreibe mp3 in die Datei cache/b2b0061ae8da22eb45bdd7b2d8b41946.mp3 mit 1691 Bytes
2017.06.09 21:02:12 4: Text2Speech: Bearbeite jetzt den Text: Hallo
2017.06.09 21:02:12 4: Text2Speech: cache/b2b0061ae8da22eb45bdd7b2d8b41946.mp3 gefunden, kein Download
2017.06.09 21:02:12 4: Text2Speech_CalcMP3Duration: cache/b2b0061ae8da22eb45bdd7b2d8b41946.mp3 hat eine Länge von 1 Sekunden.
2017.06.09 21:02:12 4: Text2Speech:/usr/bin/mplayer   -nolirc -noconsolecontrols cache/b2b0061ae8da22eb45bdd7b2d8b41946.mp3
Cannot find HOME directory.
MPlayer2 2.0-728-g2c378c7-4+b1 (C) 2000-2012 MPlayer Team
Terminal type `unknown' is not defined.

Playing cache/b2b0061ae8da22eb45bdd7b2d8b41946.mp3.
Detected file format: MP2/3 (MPEG audio layer 2/3) (libavformat)
[lavf] stream 0: audio (mp3), -aid 0
Clip info:
 encoder: Lavf54.21.100
Load subtitles in cache/
Selected audio codec: MPEG 1.0/2.0/2.5 layers I, II, III [mpg123]
AUDIO: 8000 Hz, 2 ch, s16le, 8.0 kbit/3.12% (ratio: 1000->32000)
AO: [pulse] 8000Hz 2ch s16le (2 bytes per sample)

Hat es vielleicht etwas mit TTS_Quality zu tun? Oder Volume?

Wernieman · 09 Juni 2017, 21:10:08

Nur 2 Bemerkungen am Rande:
1. Du verwendest nicht also sondern pulseaudio

ZitatAO: [pulse] 44100Hz 2ch s16le (2 bytes per sample)

Deshalb ging die direkte Angabe der Hardware nicht
2. Könntest Du bitte, anstatt mehrere Beiträge hintereinander zu schreiben, den älteren editieren? Macht es etwas übersichtlicher ...

Für die Lösung des Problems könnte man teoretisch auch pulseaudio passend konfigurieren ... nur bin ich da kein Spezialist