Spracherkennung mit deep speech und common voice

Simon90 · 10 Mai 2020, 10:47:03

Ich möchte an dieser Stelle nochmal auf die beiden Projekte common voice und deep speech von mozilla aufmerksam machen.

Common Voice sammelt Audioaufnahmen und deren Transskripte. Deep Speech ist ein Algorithmus, , um ein Sprachmodell zu trainieren, dass zur Spracherkennung genutzt werden kann. Der Algorithmus ist schon sehr gut ausgereift.

Für die deutsche Sprache gibt es aber zu wenig Daten, um das Sprachmodell zu trainieren. Vorteil des Algorithmus ist die Ausführbarkeit auf rechenschwachen Geräten (raspberry pi ist vollkommen ausreichend), die lokale Ausführbarkeit und die quelloffene Umsetzung.

Ich möchte deshalb darum bitten, aktiv an common voice mitzuarbeiten. Je mehr Sprachdaten ihr selbst liefert, desto besser wird das Modell auch auf Eure Stimme trainiert.

Hier könnt ihr teilnehmen:
https://voice.mozilla.org/de

FHEM Forum

Spracherkennung mit deep speech und common voice

Simon90