Alexa und Datensicherheit

Begonnen von KölnSolar, 12 Februar 2017, 11:38:44

Vorheriges Thema - Nächstes Thema

KölnSolar

Hallo,
so langsam freunde ich mich mit Sprachsteuerung an und hege den Gedanken mir einen echo dot zuzulegen.

Skeptisch bin ich bzgl. Datensicherheit. Ich nutze weder Facebook, noch WhatsApp oder andere Clouddienste. Mein Prinzip: meine Daten gehören mir und sind (möglichst) auch nur in meinem lokalen Umfeld verfügbar. Dieses Prinzip und die Alexa-Nutzung schließen sich leider gegenseitig aus  :'(
Andre hat zum Thema schon einmal folgendes geschrieben
Zitat- wenn du prinzipiell damit klar kommst das die sprache in der cloud erkannt wird, das die audio files in der cloud liegen und das ein gerät in deiner wohnung potentiell immer mit lauscht
und hier sind auch meine Bedenken relativ treffend beschrieben https://www.externedatenschutzbeauftragte.de/blog/amazon-echo-box.html
Auch dieser Artikel macht mich nicht wirklich happy https://www.it-daily.net/it-sicherheit/datenschutz/14342-siri-alexa-co-was-wissen-die-intelligenten-sprachassistenten

Was gar nicht beleuchtet wurde: Der Port 3000 muss ja wohl "geöffnet" werden. Wird man dadurch nicht potentiell angreifbarer ? (ok, beim Port 80 mache ich mir zugegebener Maßen auch keine Gedanken darüber :-\)

Speichert Amazon alles, was Alexa so zu hören bekommt ? Oder ist das erst einmal nur die Gefahr, weil alles zur Spracherkennung übertragen wird ? Es wäre doch so einfach gewesen die Ansprache "Alexa" lokal zu halten und nur darauf folgende Audiodaten in die Cloud zu übertragen. Oder ist das genau so ? Gäbe mir den Anstoß für den Alexa-Einsatz.

Schließlich ist da noch der Mikrofonschalter. Geht das wirklich nur an dem physischen Schalter oder auch per App, http, also FHEM ?
Wenn es nicht per Software geht: Lassen sich die Dosen einfach öffnen und ein Funkschalter einbauen ?

Freue mich auf Eure Antworten
Markus
RPi3/2 buster/stretch-SamsungAV_E/N-RFXTRX-IT-RSL-NC5462-Oregon-CUL433-GT-TMBBQ-01e-CUL868-FS20-EMGZ-1W(GPIO)-DS18B20-CO2-USBRS232-USBRS422-Betty_Boop-EchoDot-OBIS(Easymeter-Q3/EMH-KW8)-PCA301(S'duino)-Deebot(mqtt2)-zigbee2mqtt

budy

Moin,

also, Alexa hört lauscht lokal - und das tut sie natürlich immer, denn sonst hätte das ja keinen Sinn, auf ihr Aktivierungs-Wort (Alexa, Echo, Computer...). Erst wenn Alexa dieses Wort erkennt, wird die Sprachaufzeichnung aktiviert - erkennbar daran, dass der LED-Ring zu leichten beginnt. Alles, was Alexa dann aufzeichnet wird in die Amazon Cloud gesendet, zwecks Spracherkennung.

Ich beäuge meinen Echo auch die ganze Zeit, aber bis auf ein paar "Fehlalarme" beim Fernsehen, konnte ich bisher keine Fehl-Aktivierungen feststellen.

Man muss also ganz alleine für sich entscheiden, ob dieses Vorgehen für einen selbst akzeptabel ist.

Gruß,
Stephan
Debian stretch, FHEM 5.9.
HM-CC-RT-DN, HM-ES-PMSw1-Pl, HM-LC-Dim1TPBU-FM, HMUARTLGW, HMLAN, HM-SEC-KEY, HM-SEC-RHS, HM-SEC-SC-2, HM-SEC-SCo, HM-SEC-SD-2, HM-OU-CFM-TW, div. HUEs, Wifilight, Ring Video Pro

fischit

Moinsen,

du kannst dir in der Alexa App jeden deiner Sprachbefehle auch erneut anhören (klar, liegt ja schließlich in der Cloud) bzw. kannst dort auch sagen, dass die Eingaben eben nicht gespeichert werden sollen. Laut Amazon werden diese Daten dann nicht dauerhaft gespeichert  ::)

vbs

#3
Zitat von: KölnSolar am 12 Februar 2017, 11:38:44
Was gar nicht beleuchtet wurde: Der Port 3000 muss ja wohl "geöffnet" werden. Wird man dadurch nicht potentiell angreifbarer ? (ok, beim Port 80 mache ich mir zugegebener Maßen auch keine Gedanken darüber :-\)
Ich würde in jedem Fall einen Reverse-Proxy (nginx/Apache o.ä.) mit HTTP-Authentication davor setzen, so dass alexa-fhem erst nach erfolgreicher Authentifizierung überhaupt erreichbar ist. Entsprechende Anmeldedaten kann man einfach der Lambda-Funktion mitgeben.

Sieht bei mir im Moment so aus:
  var options = {
    hostname: process.env.HOST,
    port: process.env.PORT,
    //family: 6,
    //path: '/',
    method: 'POST',
    auth: process.env.AUTH,
    //rejectUnauthorized: false, // accept self-signed
    headers: {
      'Content-Type': 'application/json',
      'Content-Length': Buffer.byteLength(post_data)
      }
    };


Die Variablen HOST, PORT und eben AUTH dann auf der Webseite unter dem Code als Environment Variable eintragen. Dann muss man den Code nicht mehr anfassen. AUTH wird belegt mit "<name>:<password>".

Wenn man über ein signiertes SSL-Zertifikat verfügt dann "rejectUnauthorized: true" setzen.

KölnSolar

Danke für Eure Antworten. Dann ziehen wir mal ein Zwischenfazit.
ZitatErst wenn Alexa dieses Wort erkennt, wird die Sprachaufzeichnung aktiviert - erkennbar daran, dass der LED-Ring zu leichten beginnt. Alles, was Alexa dann aufzeichnet wird in die Amazon Cloud gesendet, zwecks Spracherkennung.
Dann vertrau ich amazon mal, dass nur beim Leuchten des Rings Daten ins Netz gehen.  :D Das wäre ja positiv und mein dot ist so gut wie unterwegs  ;D

ZitatIch würde in jedem Fall einen Reverse-Proxy (nginx/Apache o.ä.) mit HTTP-Authentication davor setzen, so dass alexa-fhem erst nach erfolgreicher Authentifizierung überhaupt erreichbar ist.
Das beherzige ich dann, wenn ich mit der Einrichtung beginne. Einen proxy hab ich schon früher unter Windows eingerichtet. Aber einen reverse-proxy ? Muss der dann auf dem FHEM-Server oder dem Router laufen ?
RPi3/2 buster/stretch-SamsungAV_E/N-RFXTRX-IT-RSL-NC5462-Oregon-CUL433-GT-TMBBQ-01e-CUL868-FS20-EMGZ-1W(GPIO)-DS18B20-CO2-USBRS232-USBRS422-Betty_Boop-EchoDot-OBIS(Easymeter-Q3/EMH-KW8)-PCA301(S'duino)-Deebot(mqtt2)-zigbee2mqtt

vbs

Zitat von: KölnSolar am 12 Februar 2017, 16:15:06
Das beherzige ich dann, wenn ich mit der Einrichtung beginne. Einen proxy hab ich schon früher unter Windows eingerichtet. Aber einen reverse-proxy ? Muss der dann auf dem FHEM-Server oder dem Router laufen ?
Wo der läuft ist eigentlich egal. Er muss nur das "echte" alexa-fhem erreichen können und von außen erreichbar sein. Wird bei dir aber vermutlich der FHEM-Server werden, rate ich mal.

raimundl

Ganz einfach: nicht verwenden!
Homematic: Licht, Heizung, Alarm, Alexa ... auf einen RaspberryPi3+mit OS "Stretch" und RPI-RF-MOD mit piVCCU3 (HMCCU), ca. 40 HM Komponenten, alexa, MobileAlerts, Hue Ledstripes....

cyvr1

@KölnSolar
ZitatDann vertrau ich amazon mal, dass nur beim Leuchten des Rings Daten ins Netz gehen.  :D Das wäre ja positiv und mein dot ist so gut wie unterwegs  ;D

Dem ist auch so und das kann man mit einem WLAN Sniffer Tool (z.B. WireShark) auch relativ leicht prüfen. Ich habe WireShark einen Tag im WLAN mitlaufen lassen und außer bei der Ansprache mit "alexa" hat der Dot keine Daten über das WLAN übertragen.

Wie kann man nun sicher sein, dass nicht permanent aufgezeichnet wird und Daten zusammen mit einer regulären Anfrage übertragen werden? Nun, relativ sicher kann man sein, wenn man sich die Anzahl der Pakete und die Paketgröße ansieht, die über das WLAN geht. Und die ist bei ein und der selben Anfrage relativ gleich groß, egal ob man sich vorher im Raum ohne Einbeziehung von "Alexa" unterhalten hat den Dot zurücksetzt (vom Konto abmeldet) und unter einem anderen Konto wieder anmeldet und direkt danach die gleiche Frage an Alexa richtet. Insofern mache ich mir persönlich weniger Gedanken über Daten, die ohne mein Wissen (keine Fragen an Alexa) an Amazon gehen. Die Unterschiede in den Paketgrößen bzw. Anzahl der Pakete sind marginal und kommen vermutlich durch den übertragenen Zeitstempel zustande. jedenfalls könnte man in die Größenunterschiede keine Sprachaufzeichnung von mehreren Minuten oder Stunden packen.

----------
Stephan Krätzschmar

rr725

Zitat von: cyvr1 am 15 Februar 2017, 13:36:30
@KölnSolar
Dem ist auch so und das kann man mit einem WLAN Sniffer Tool (z.B. WireShark) auch relativ leicht prüfen. Ich habe WireShark einen Tag im WLAN mitlaufen lassen und außer bei der Ansprache mit "alexa" hat der Dot keine Daten über das WLAN übertragen.

nun ja- mag sein...mit diesem Software releasestand, wer weiss wie es mit zukünftigen aussieht.
und ich bin mir sicher,....dass das micro remote eingeschaltet werden kann, schliesslich wartet alexa ja via skill auch hier und da auf eine antwort, wo das micro offensichtlich eingeschaltet bleibt bis eine antwort erfolgt ist, oder abgebrochen wird.

wenn man sich sorgen macht sollte man sich amazon echo nicht anschaffen. nur, auch ein handymicro kann remote eingeschaltet werden- und ? verzichtet jemand darauf ?

cyvr1

Zitat
wenn man sich sorgen macht sollte man sich amazon echo nicht anschaffen.

Wenn man sich darüber sorgen macht, sollte man vor allem sein Smartphone abschaffen. Da sind noch ganz andere Sachen möglich, dagegen ist Alexa ein Witz. Und das Internet nicht vergessen!

----------
Stephan Krätzschmar

marvin78

Das ist natürlich eine prima Argumentation. Daumen hoch dafür  ::)

cyvr1

Mag etwas übertrieben sein, im Kern aber nicht falsch. Natürlich sind Bedenken berechtigt, doch der Hauptvorwurf bzw. -verdacht lautet ja, Alexa kann einen ausspionieren. Und da muss man schon mal darauf hinweisen, dass das über andere Geräte und Medien, die wir täglich nutzen, genau so gut oder viel einfacher möglich ist. Allein was Laute auf Facebook freiwillig täglich einstellen  ist vom Inhalt her mindestens genau so interessant. Und damit macht Facebook ja auch das meiste Geld.

Aber das führt jetzt hier zu weit. Wer Bedenken hat, sollte den Echo nicht kaufen, basta. Nur zu denken, man sonst gibt keine Daten raus und wäre sonst in keine weise angreifbar ist naiv.

----------
Stephan Krätzschmar

Wernieman

#12
Zitat von: cyvr1 am 15 Februar 2017, 16:41:22
Mag etwas übertrieben sein, im Kern aber nicht falsch. Natürlich sind Bedenken berechtigt, doch der Hauptvorwurf bzw. -verdacht lautet ja, Alexa kann einen ausspionieren. Und da muss man schon mal darauf hinweisen, dass das über andere Geräte und Medien, die wir täglich nutzen, genau so gut oder viel einfacher möglich ist. Allein was Laute auf Facebook freiwillig täglich einstellen  ist vom Inhalt her mindestens genau so interessant. Und damit macht Facebook ja auch das meiste Geld.

Aber das führt jetzt hier zu weit. Wer Bedenken hat, sollte den Echo nicht kaufen, basta. Nur zu denken, man sonst gibt keine Daten raus und wäre sonst in keine weise angreifbar ist naiv.

Wobei Du es etwas hart formulierst.

Das man sich bei JEDEM Gerät, was Daten in der Cloud legt sich Gedanken macht ist sogar SEHR Sinnvoll.

Amazon/Google/Apple etc. leben gerade davon. das sich 99% der Leute keine Gedanken macht sondern (primitiv gesagt) naiv ist
- Bitte um Input für Output
- When there is a Shell, there is a Way
- Wann war Dein letztes Backup?

Wie man Fragen stellt: https://tty1.net/smart-questions_de.html

marvin78

Dass man Bedenken wegen Alexa hat, heißt noch lange nicht, dass man die nicht auch bei anderen Dingen hat oder generell nicht in der Lage ist, über den Tellerrand zu schauen. Es gibt aber natürlich Dinge, bei denen ich etwas mehr Kontrolle haben kann, als bei einem extrem geschlossenen System, wie Alexa der Fall ist und dazu gehören auch deine Beispiele (ggf.).

Der Thread hier ist wohl genau dafür da, solche Bedenken entweder zu bestätigen oder zu zerstreuen bzw. ggf. auch Wege zu finde, etwas mehr Kontrolle zu erlangen. Deshalb passt deine Argumentation schlicht nicht. Es geht um Alexa und nicht um das Smartphone.

vbs

Der Hinweis mit dem Smartphone ist natürlich sehr berechtigt. Es wurde zwar nach Alexa's Datensicherheit gefragt, aber es ist in diesem Zusammenhang sogar notwendig, darauf hinzuweisen, dass jeder (?) von uns in Form eines Smartphones ein um ein vielfaches mächtigeres Überwachungsgerät Tag und Nacht am Körper bzw. in unmittelbarer Reichweite mit sich führt. Wie das der einzelne dann bewertet, muss natürlich jeder mit sich selbst ausmachen und das sollte man dann auch respektieren.
Ich hab ehrlich gesagt schon auf den Verweis zum Smartphone gewartet ;)

thunder1902

@vbs Könntest du mal Deine nginx-Konfiguration hier posten? Das wäre super!

vbs

Also ich hab es aktuell so:
    server {
        listen <Port>;
        server_name  <Domain>;

        access_log  /var/log/nginx/access.alexa.log;

        ssl on;
        ssl_certificate           /etc/letsencrypt/live/<Domain>/fullchain.pem;
        ssl_certificate_key       /etc/letsencrypt/live/<Domain>/privkey.pem;

        location / {
          proxy_pass https://localhost:3000;
          proxy_redirect off;
          proxy_buffering off;
          proxy_read_timeout 2073600;

          auth_basic "Restricted Access";
          auth_basic_user_file <passwort-Datei>;
        }
    }


Dazu am besten:

  • echte Domain benutzen mit signiertem SSL-Zertifikat (zB letsencrypt)
  • <passwort-Datei> für HTTP-Authentication anlegen
  • <Port> und <Domain> muss dann bei der Lambda-Funktion als HOST und PORT hinterlegen

Dann die Lambda-Funktion wie hier anpassen:
https://forum.fhem.de/index.php/topic,66933.msg583092.html#msg583092