grüße euch,
ich arbeite grade an meiner zukünftigen nas und da die schon recht gut rennt, bin ich grade bei der kür angelangt.
dazu hab ich mir einen docker-container mit mimic3 von mycroft gefüllt.
selbiger funzt wunderbar (tts-quali entspricht zwar nicht ganz meinem wunschtraum, aber was solls, dafür wird mir eure merkel in zukunft informationen zuflüstern *g*).
hat sich da schon wer mit gespielt, die mimimc3 per fhem zu befüllen?
wenn ja, dürft ich da ein bissi abschreiben?
falls benötigt:
mimic3 ist per webinterface über http://192.168.178.3:59125 zu erreichen
die testversion von fhem unter http://192.168.178.3:8083
btw - ich will keine befehle senden, ich will wirklich nur die mimic3 tts verwenden. der rest von mycroft interessiert mich (derzeit) nicht wirklich.
für jede info dankbar ...
Hi,
wie willst Du den Sound denn verwenden? Du hast nicht diesen platt gefahrenen R2D2 zur Ausgabe?
Am Ende produziert die Engine ja nur ein wav File was man in die Ausgabe schicken muss. Ist sicher irgendwie machbar.
BTW: Irgendwo habe ich gelesen, mycroft ist gescheitert. Das hier liest sich auch so:
https://mycroft.ai/blog/update-from-the-ceo-part-1/
Gruß Otto
der sound kommt dann direkt von 'nem lautsprecher. wahrscheinlich an der nas selber. muss ich mir noch überlegen. die ls-lösung wäre zumindest auch die derzeitige.
am ende produziert die engine auch eine soundausgabe am server oder client, wenn man's den so will. zumindest bietet das webinterface schon mal die möglichkeit dazu und ich habe es auch erfolgreich getestet.
ich nehm anstelle mycrofts auch gern eine andere offline-tts, die unter linux rennt und mir nicht aufgrund der üblich miesen qualität die ohren zerstört *g*.
dazu kommt bei mir noch, dass es möglichst idiotensicher sein muss. ich seh grade wieder mit meinen "zukunfts-nas-versuchen", wie blöd ich mich unter linux aufführe und die mimic3 hat sich erstaunlich wenig gegen meine unkenntnis, es zum laufen zu bringen, gewehrt.
bis jetzt verwend' ich die offline-tts von windows. die qualität wäre natürlich schön, gibts aber wohl unter linux eher nicht. da lass' ich mich aber gern eines besseren belehren.
was das überleben mycrofts angeht - immerhin haben sie ja jetzt mal ihren mycroft2. wenn das ding zu dem preis auch sicher keiner kaufen wird ... ich hätte nicht mal gedacht, dass die so weit kommen.
OK, klingt einfach :)
Du brauchst also "nur" einen Befehl absetzen. Wie war denn dein Testbefehl wo Du erfolgreich Sound gehört hast?
Zitat von: Otto123 am 17 Juni 2023, 15:44:21BTW: Irgendwo habe ich gelesen, mycroft ist gescheitert. Das hier liest sich auch so:
https://mycroft.ai/blog/update-from-the-ceo-part-1/
Das Unternehmen Mycroft hat die Geschäfte eingestellt. Der Software-Stack lebt weiter unter:
https://github.com/OpenVoiceOS und http://neon.ai/Download
Inoffizieller Nachfolger von Mimic3 ist Piper: https://github.com/rhasspy/piper
Verwendet ähnliche Technologie und stammt vom selben Entwickler
der bringt einfach ne website als interface mit. da gibst du deinen text ein und suchst dir aus, was du gerne wie hören würdest. ich hab aber no ned mal g'schaut, ob der nicht auch 'ne api am laufen hat, was ich dann doch sehr stark annehme, weils auch gleich unterm sendebutten nen link gibt *g*.
eigentlich hab ich bisher nur mal das ding zum laufen gebracht und mich umgesehen, ob schon wer was für fhem gebastelt hat, bevor ich wieder was eigenes, halb kaputtes baue.
interessiert am probieren? hast 'nen docker am laufen? wenn ja: pull dir mycroftai/mimic3
schaut dann so aus: Screenshot 2023-06-17 202306.jpg
im file hab ich
services:
mycroft:
image: mycroftai/mimic3
container_name: mycroft
ports:
- 59125:59125
volumes:
- /docker_container/mimic3:/home/mimic3/.local/share/mycroft/mimic3
restart: unless-stopped
env is leer
den teil "/home/mimic3/.local/share/mycroft/mimic3" mußt du eventuell händisch anlegen und mit rechten versorgen.
aufrufen kannst die seite dann unter http://localhost:59125/
NACHTRAG:
uij, auch da gibts 'nen container .... https://github.com/OpenVoiceOS/ovos-docker
ok, ich hatte was von commandline und api gelesen. Über die Webseite macht es ja quasi der Browser lokal.
Ich schau vielleicht mal, wird aber ein paar Tage dauern ;)
https://forum.fhem.de/index.php?msg=1227529
hihi, da grabens wieder sachen aus.
thx otto. nur ned hetzen. wies ausschaut gibts da ja eh schon wieder was von ratiopharm *lach*
deshalb thx auch ans betateilchen für den link.
@Beta-User
ist im ersten link text2speech.pm vollständig, oder muss ich dann auch den patch irgendwie einbinden?
nachtrag:
wie macht sich denn dieses marytts, die du da erwähnst? leider geht deren online-demo nicht.
Die .pm ist vollständig, im dort verlinkten thread ist dann nur der patch.
maryTTS ist eine weitere offline-tts-engine, die ich aber nie installiert hatte.
Die .pm dürfte auch mit dem mimic3-Nachfolger funktionieren; die ist generisch ausgelegt, soweit ich mich entsinne.
ich wette ja, ich hab wieder was vergessen:
2023.06.18 13:12:33 3: TTS: Fehler beim Abrufen der Daten von maryTTS: http://192.168.178.3:59125/process?INPUT_TYPE=TEXT&OUTPUT_TYPE=AUDIO&AUDIO=WAVE_FILE&LOCALE=de_DE&VOICE=de_DE/thorsten_low&INPUT_TEXT=test: Select timeout/error:
2023.06.18 13:12:33 3: TTS: MP3WRAP Fehler!, Datei wurde nicht generiert.
2023.06.18 13:12:33 2: TTS: Mp3Wrap Datei konnte nicht gefunden werden.
als readings gabs dazu:
lastFilename cache/d41d8cd98f00b204e9800998ecf8427e.mp3 2023-06-18 13:15:16
playing 1 2023-06-18 13:14:46
"lastfilename" hat im sekundentackt obigen fehler immer wieder neu gebaut
define TTS Text2Speech hw=0.0
attr TTS TTS_Language Deutsch
attr TTS TTS_MplayerCall /usr/bin/mplayer
attr TTS TTS_Quality 48khz_16bit_mono
attr TTS TTS_Ressource maryTTS
attr TTS TTS_UseMP3Wrap 1
attr TTS TTS_User host=192.168.178.3 port=59125 lang=de_DE voice=de_DE/thorsten_low
attr TTS room frontends
# ALSADEVICE hw=0.0
# DEF hw=0.0
# FUUID 648ee273-f33f-98b1-6829-f344ffc741823c5d
# MODE DIRECT
# NAME TTS
# NR 46
# STATE Initialized
# TYPE Text2Speech
# READINGS:
# 2023-06-18 13:15:16 lastFilename cache/d41d8cd98f00b204e9800998ecf8427e.mp3
# 2023-06-18 13:14:46 playing 1
# helper:
#
setstate TTS 2023-06-18 13:15:16 lastFilename cache/d41d8cd98f00b204e9800998ecf8427e.mp3
setstate TTS 2023-06-18 13:14:46 playing 1
Das OS muss das Programm mp3wrap kennen, in der commandref oder im Wiki müßte eine (kurze) Anleitung dazu drin sein. Das scheint zu fehlen?
Ansonsten weiß ich nicht mehr so recht, wie man das Testen kann; Die prinzipielle Funktionalität des Dienstes an sich sollte bei mimic3 über ein Web-Interface abprüfbar sein.
es wird langsam ... es fehlte "lame" auf dem debian
jetzt macht er schon was, nur noch nicht abspielen *g*
LAME 3.100 64bits (http://lame.sf.net)
Using polyphase lowpass filter, transition band: 8269 Hz - 8535 Hz
Encoding cache/ab3e20bd97c9afed5416314e2daf46a5.mp3.wav
to cache/ab3e20bd97c9afed5416314e2daf46a5.mp3
Encoding as 22.05 kHz single-ch MPEG-2 Layer III (11x) 32 kbps qval=3
Frame | CPU time/estim | REAL time/estim | play/CPU | ETA
0/ ( 0%)| 0:00/ : | 0:00/ : | x| :
00:01--------------------------------------------------------------------------
kbps % %
0.0 ␛[A␛[A␛[A
0/62 ( 0%)| 0:00/ 0:00| 0:00/ 0:00| 0.0000x| 0:00
00:01--------------------------------------------------------------------------
kbps % %
0.0 ␛[A␛[A␛[A
62/62 (100%)| 0:00/ 0:00| 0:00/ 0:00| 116.25x| 0:00
-------------------------------------------------------------------------------
kbps mono % long switch short %
32.0 100.0 74.2 16.1 9.7
ReplayGain: -7.1dB
immerhin keine fehlermeldung (mit mp3wrap ein)
jetzt ists halt wie immer bei mir: das grundwissen fehlt. ich denke, da fehlt "nur mehr" das audiogerät oder so?
duration 2 2023-06-18 16:35:07
endTime 00:00:00 2023-06-18 16:35:07
lastFilename cache/ab3e20bd97c9afed5416314e2daf46a5.mp3 2023-06-18 16:35:09
playing 0 2023-06-18 16:35:09
Na ja, das "allgemeine Text2speech-environment" sollte schon da sein - zum Abspielen braucht es dann ggf. wieder einen player.
hab ich nach anleitung aufgesetzt mplayer ... geh morgen nochmal alles durch.
Zitat von: the ratman am 18 Juni 2023, 21:37:01hab ich nach anleitung aufgesetzt mplayer ... geh morgen nochmal alles durch.
Falls der alsa nutzt: in der Regel ist die Soundausgabe dort erst mal stumm geschaltet (=> alsamixer) (und der ausführende user muss zur audio-Gruppe gehören).
hast recht, war auf 0. aber scheinbar hab ich ein problem mit der hardware.
ich krieg' im alsamixer nur den master und 3 mal spdif angezeigt + 1 mal loopback. ich denke also, das abspielen findet statt, wird auch angezeigt, aber leider nicht am richtigen ausgang, was ich lustig finde, weil das ding nicht mal einen digitalen ausgang hat, sieht man vom monitorausgang mal ab ... hmm, ich such' mal einen monitor, mit audioausgang. vielleicht ... der hdmi-ausgang macht auch keinen mux.
root@luke-8:~# cat /proc/asound/cards
0 [PCH ]: HDA-Intel - HDA Intel PCH
HDA Intel PCH at 0xdc240000 irq 132
root@luke-8:~# cat /proc/asound/devices
2: [ 0- 0]: digital audio playback
3: [ 0- 0]: digital audio capture
4: [ 0- 3]: digital audio playback
5: [ 0- 7]: digital audio playback
6: [ 0- 8]: digital audio playback
7: [ 0- 0]: hardware dependent
8: [ 0- 2]: hardware dependent
9: [ 0] : control
33: : timer
aja, falls du noch helfen kannst/willst:
die hardware ist ein alter i3 (gen7) intel nuc.
in fhem zeigt er eindeutig das abspielen des soundfiles an.
nachtrag für die kür:
zur kompletten verwirrung hätte ich zusätzlich noch eine ganz andere frage, bevor hier alle linux-pros schreiend von mir weg rennen *g* ... ich habe auf meiner derzeitigen win-nas ein programm namens "directory monitor" am laufen. das ding überwacht verzeichnisse auf z.b. neu eintreffende files mit bestimmten namensteilen/endungen und sendet mir dann anhand dieser div. befehle an fhem.
ich suche nun unter linux was ähnliches. gefunden hab ich "watchman". das ist aber leider irgendwie ... naja. kennt da jemand was besseres? muss ja nicht klicki-bunti sein, aber so ein bissi übersicht für schnelle änderungen nach der durchzechten partynacht wäre super.
bitte keine großen anstrengungen - wenn die idee schon im kopf ist --> link reicht, bloß kein aufwand. wenn das in zukunft nicht funzt, kann ich mit leben und hab ne alternative, die halt nicht ganz so gut ist. wäre also nur ein nice2have.
Zum Nachtrag:
Unter Linux gibts inotify, basierend darauf das FHEM-Modul inotify, damit kann man auch Verzeichnisse einer NAS überwachen.
Hmmm, audio unter Linux ist leider oft komisch. Immerhin kommt ja was bei alsa an.
Einen Kopfhörer-Ausgang gibt's nicht? Der kann uU. auch als Digital-Ausgang konfiguriert sein....
Ansonsten bin ich da auch lost, zumal mein FHEM-Server keine direkte Soundausgabe macht.
Den nächsten werde ich dann mit snapcast-server aufbauen - wenn ich da dann den Durchblick habe, gibt's ne Anleitung dazu, hat aber low prio.
Aber dafür war das gepatchte T2s....
vielen danke @TomLee das erleichtert das leben!
@Beta-User einen kopfi-ausgang gibts (gemeinsamer kopfi und mic, was ich so derartig nicht mag *g*) - der wäre auch mein favorit dafür.
du siehst in meiner devices-liste aber auch keinen kandidaten, oder?
dieser tage probier ich dann noch usb-audio. wenn ich meine alte usb-soundkarte wo finde ... wenn das auch ned mag ...
ich neide dir übrigens das wissen darüber, ob du es bist, oder linux, das grade nicht funzt.
sagts mal: der fhem-container für docker, hat der sound und so zeugs auch schon mit dabei, oder würde ich mich da ebenso blöd spielen müssen?
wäre übrigens mal ne neue dau-freundliche geschichte, würde man über fhem gleich so zeug wie sound installieren und einstellen können. ja ja, ich weiß schon ...
Zitat von: the ratman am 19 Juni 2023, 11:25:58sagts mal: der fhem-container für docker, hat der sound und so zeugs auch schon mit dabei, oder würde ich mich da ebenso blöd spielen müssen?
Also eventuell gibt es da 100 Wege zum Sound im docker, ich habe für mich mal den ausgearbeitet und dokumentiert. Der entscheidende Satz ist der erste im Abschnitt:
ZitatIch habe ein paar Varianten gefunden, für mich aber beschlossen den Pulseaudioserver über das Netzwerk zu nutzen
https://heinz-otto.blogspot.com/2022/04/andocken-dinge-die-man-auerhalb-docker.html
Die grundlegende Sound Einrichtung auf einem debian System hatte ich hier aufgeschrieben
https://heinz-otto.blogspot.com/2022/03/debian-setup-mal-nicht-all-inclusive.html
Da geht es dann auch um pulseaudio Server, der Vorteil: einmal auf dem Host eingerichtet ist das Ding ist dann mit wenig Aufwand aus dem Netzwerk (also auch von docker) nutzbar.
Aufgrund der Anleitungen im Netz befürchte ich: das wird bei jeder Linuxversion wieder etwas anders :o
Zur Ergänzung: snapcast setzt (serverseitig) auf pulseaudio auf. Ist also auch Teil meines Weges....
thx @Otto123 - mal angucken, vielleicht kann ich ja dann noch was installieren *lach* - system und daten 2%, audio 98% des speichers benötigt *totlach*
ZitatAlso eventuell gibt es da 100 Wege zum Sound im docker,
ich will doch nur einen funktionierenden haben ... mehr will ich gar nicht, ich schwöre ...
was bin ich froh, dass ich diesmal keinen gau hab und eilig was neues brauch - ich hab (hoffentlich) noch monate zeit um mich über linux zu ärgern und dann immer noch nix kapiert zu haben *g*
mir dünkt, das größte problem hab ich hinter mir, wenn ich auch nix zu getan habe.
heute fahr' ich die nas wieder hoch, will ottos anleitung nachbasteln, geht aber schon von haus aus alles. erst der funktionstest, den otto vorschlägt (ist des gewollt, dass es nur li lärm macht?). nicht, dass ich gestern nicht auch schon mehrfach restartet hätte - nur zur sicherheit ...
und ich höre meine tests in fhem - juhuu - auf beiden lautsprechern.
irgendwas scheint aber noch nicht zu 100% zu funzen. hab testweise die hütte 10 mal gestartet, einmal ging der sound nicht. anzeige war aber wieder so, als ob alles funktioniert hätte.
gut, nachdem eine zukünftige nas wohl nicht 10 mal am tag neu gestartet werden wird, wärs nicht so schlimm, aber ein unangenehmes bauchgefühl bleibt mal.
falls also noch wer ne ahnung hat, wo ich unter linux den schalter "jetzt verarsche ich den onkel ratti mal kräftig [AN]" finde, würde ich mich über ne info nicht beschweren. ansonsten tun wir mal so, als ob eh alles passt.
ich sag' auf jeden fall mal artig "vielen dank ihr linuxer" und warne vor erneuten problemen, mit denen ich euch sicher nerven werde *g*
kleine zusatzinfo: inotify rennt auch schon mal grundlegend - wunderbar!
und doch noch ne frage *g*:
mein zukünftiges backup-konzept für die nas sieht eine spiegelung auf einen fast baugleichen nuc vor. kann ich aber nicht testen, weil die zukünftige backup-nas die jetzige für den echtbetrieb ist.
grundlegend will ich beim supergau einfach nur den "kaputten" nuc aus- und den backup-nuc ein-schalten. sprich: ein - sagen wir mal - wöchentliches backup im laufenden betrieb, sodas der backup-nas sofort einspringen kann, wenns mal kracht.
wie würdet ihr das auf "faul&idiotensicher" regeln? gleich irgendwas aus den 1000 backuplösungen von omv nehmen, oder doch was anderes?
Wg. audio: Falls HDMI + ext. Verstärker:
UU. hängt es davon ab, ob der an oder aus ist, wenn der nuc bootet, ob sound an der erwarteten stelle kommt. Die Schilderung klingt nach einem "falschen" default in der alsa-Konfiguration (oder pulseaudio?)
gut zu wissen.
also - auffällig is halt, dass gestern kein pcm im mixer zu sehen war. der ist heute da - ob man was hört, oder nicht. man könnte also darauf tippen, dass da der nuc vielleicht schon irgendwie "besonders" ist, was ja auch so ein bissi zu deiner aussage passen würde.
vor allem wars dann halt auch noch mein kopfi gestern und heute an der klinke des nuc. sollte ich eventuell 'nen anderen probieren, das ding hat 250 ohm. vielleicht is das dem nuc ja manches mal zu viel des guten. jetzt, wo ich drüber nachdenke, hat der andere nuc unter win auch gern mal gesponnen in sachen klinkenstecker.
aber schauen ma mal ... morgen trudelt eine mini soundbar mit 3,5er klinke ein. stromversorgung über den lade-usb des nuc - dann sollte das ja auch kein problem sein. und wenn doch: der schleppi meiner holden braucht eh mehr wumms *g* und ich probiers mit einer usb-soundkarte (sofern ich die jemals wieder finde).