lunes, 3 de diciembre de 2018

"Qué es lo que realmente escuchan, almacenan y procesan Alexa, Assistan y Siri."







30 Noviembre 2018 - Actualizado 2 Diciembre 2018, 23:08





Qué es lo que realmente escuchan, 
almacenan y procesan Alexa, Assistant y Siri.





Los asistentes de voz están de moda. Los altavoces inteligentes de Amazon o de Google se han convertido en uno de los potenciales regalos estrella de estas navidades, y ahora tanto el asistente de Google como Alexa o Siri hablan español es conveniente hacerse una pregunta: ¿qué escuchan y guardan de todo lo que hablamos alrededor de ellos?
La privacidad vuelve a estar en tela de juicio ante unas soluciones que algunos podrían pensar que nos "espían", pero como veremos a continuación todas las empresas responsables del desarrollo de asistentes de voz han tenido muy en cuenta este apartado y cuidan muy mucho los datos que se manejan y cómo se manejan.
Las máquinas quieren hablar con nosotros
Los altavoces inteligentes dan un poquito de miedo. No ya por errores anecdóticos que provocaron aquellas risas siniestras sino porque al utilizarlos no queda claro qué tipo de efectos colaterales tiene esa interacción con estos dispositivos.
Estamos rodeados de tecnología que nos escucha, pero no contentos con llevar el móvil en todas partes ahora los altavoces inteligentes también nos acompañan en el hogar, y no es el único elemento en el que los asistentes de voz está presente. Los relojes inteligentes y diversas soluciones que podríamos englobar dentro del segmento de la Internet de las cosas también pueden hacer uso de estos desarrollos.
El problema (si es que lo consideramos así) está en esa sensación de que estos productos siempre están escuchándonos, lo que amenaza la seguridad de nuestros datos y nuestra privacidad. Ocurrió por ejemplo con aquella conversación privada que un Amazon Echo acabó compartiendo con un contacto aleatorio por error, pero este tipo de situaciones son la excepción, no la regla.
En cierta forma es como si los asistentes de voz estuvieran siempre vigilándonos, aunque en realidad los fabricantes ponen a nuestra disposición bastante información para entender qué hacen estos asistentes con esos datos.
Así funcionan los asistentes de voz
Tanto los altavoces inteligentes como el resto de productos que aprovechan la capacidad de los asistentes de voz funcionan de una forma similar: se activan a través de una palabra que los despierta, lo que significa que dichos asistentes están en espera activa: siempre escuchan, pero solo prestan atención a partir del momento en el que escuchan esa palabra esoecial ("Hey Siri", "OK Google", etc) o pequeña frase de activación.


Para poder realizar esa función de espera activa estos asistentes no paran de escucharnos y realizar pequeñas grabaciones con esas palabras que escuchan y que tratan de reconocer. Si se detecta esa palabra o frase de activación, el dispositivo mantiene la grabación para procesarla, pero si no lo es esa grabación se elimina.
Una vez activamos el asistente de voz, eso sí, empieza la transferencia de datos, y aquí es importante señalar que una vez más dependemos de la nube: esa conversación y esas preguntas u órdenes no se procesan en el dispositivo como tal, sino que se transfieren a un servidor que las interpreta, las procesa y da la respuesta que nuestro asistente simplemente se encarga de ofrecernos de viva voz (sintetizada, claro).
Por lo tanto nuestra voz no se almacena en local en el dispositivo, sino que acaba en los servidores que los fabricantes de estos dispositivos y desarrolladores de estos asistentes (Google, Apple, Amazon, Microsoft) tienen preparados para toda esa ingente labor de reconocimiento del lenguaje.
Pero ¿qué datos se transfieren realmente a esos servidores? ¿Qué hacen esas empresas con esos datos? ¿Qué podemos hacer nosotros al respecto? Eso es lo que creemos importante aclarar, y lo haremos por separado para cada uno de los cuatro grandes asistentes de voz del mercado actual.
Asistente de Google
¿Que recolecta, y con qué fin?
Es importante destacar que el asistente de voz presente por ejemplo en Google Home no graba todas nuestras conversaciones. En lugar de uso el asistente "escucha pequeños fragmentos" de pocos segundos para detectar si se ha pronunciado la frase de activación. Si no es así, esos fragmentos se eliminan "y nada de esa información abandona tu dispositivo hasta que se escucha la frase de activación".

La ayuda de Google Home nos informa sobre la información que se recoge los dispositivos de la familia Google Home. De hecho existe un apartado específico que muestra los datos recolectados, y que se dividen en tres grupos.
En el primero están los datos destinados a mejorar el rendimiento y fiabilidad del dispositivo como la estabilidad de la red-WiFi, el porcentaje de éxito de la detección o la latencia, entre otros.
El segundo grupo es el que engloba las estadísticas de uso, como por ejemplo el número de interacciones en el dispositivo y qué botones pulsamos en los asistentes. También se recolectan la duración de las sesiones miltimedia y qué aplicaciones utilizamos en esas sesiones, pero aquí es importante destacar que en Google "no recogemos información sobre el contenido que se reproduce, pero es posible que el proveedor de servicios multimedia nos lo indique".
En el tercer grupo de datos recolectados están la información sobre el modelo de hardware y la revisión de software que utilizamos, pero también los procesos activos para poder establecer las posibles causas de fallos en los informes de error.
En esa ayuda también se explica cómo el asistente de Google integrado en Google Home puede acceder al historial de búsqueda "para ofrecerte respuestas mejores y más útiles", y aunque puedes darle tu dirección a Google, puedes no hacerlo, en cuyo caso el sistema "averiguará tu ubicación aproximada según tu dirección IP y otras señales para definir las alarmas en la zona horaria correcta y ofrecerte información meteorológica y sobre el tráfico relevante".
La empresa recolecta datos con el objetivo de hacer sus servicios "más rápidos, más inteligentes, más relevantes y más útiles para los usuarios", y por lo visto esa actividad con estos asistentes permite que Google Home aprenda "con el paso del tiempo, a ofrecer respuestas y sugerencias mejores y más personalizadas".
¿Dónde se guardan esos datos y qué control tenemos sobre esos datos?
Esos datos que se transfieren a los servidores de Google pasan por tanto a sus centros de datos, donde se guardan de forma indefinida a no ser que los eliminemos manualmente.
Precisamente ahí es donde entran las herramientas que Google ofrece para controlar esa actividad y esa gestión de datos. En Mi Actividad contamos con un panel de control completo en el que podremos consultar la información que Google guarda sobre nuestro uso de sus servicios, incluyendo por supuesto a los relacionados con su asistente de voz.
Es en ese panel en el que podremos encontrar todos los clips de audio que se han grabado con nuestras peticiones a estos asistentes filtrando los resultados por los que solo coincidan con "Voz y Audio". Será allí donde encontraremos las grabaciones de nuestras frases, que podremos eliminar junto a cualquier otra información que no queramos que se almacene en esos servidores.
Alexa en Amazon
¿Qué recolecta, y con qué fin?
Como sucede con el resto de asistentes, Alexa recolecta nuestras conversaciones, peticiones y órdenes de voz. Amazon las registra y procesa esa información que además puede en algunos casos ser compartida con terceras partes.
Este asistente de voz en realidad empieza a grabar "una fracción de segundo del audio" antes de que se pronuncie la palabra o frase de activación (o pulsamos un botón que active el asistente), y es entonces cuando emite esa grabación a los servidores de Amazon.
En Amazon indican que cuando usamos un dispositivo basado en Alexa, se quedan con esas grabaciones "para mejorar la precisión de los resultados proporcionados y para mejorar nuestros servicios". Como en el resto de los servicios, "eliminar esas grabaciones puede degradar tu experiencia al usar el dispositivo".
¿Dónde se guardan esos datos y qué control tenemos sobre esos datos?
Amazon cuenta con una de las infraestructuras más importantes en todo el mundo a nivel de servidores y centros de datos: no en vano su división de Amazon Web Services es una de las claves de su negocio.

Cualquier usuario de Alexa puede acceder a esas grabaciones de voz desde la aplicación de Alexa (en el apartado de privacidad) o bien en la dirección web que ofrece Amazon. Desde allí es posible eliminar esas grabaciones, aunque mientras se procesan esas peticiones podremos seguir revisando las grabaciones de voz y reproducirlas.
Una de las peculiaridades de este panel de control es que podremos también controlar los permisos que hemos concedido a otros servicios y aplicaciones que se conectan a Alexa. Es aquí donde entran en juego los "Skills", esas capacidades extra que Amazon lleva impulsando desde hace tiempo para dar más versatilidad a este asistente de voz.

En esas preferencias también podremos establecer más restricciones al uso del asistente. Dado que los dispositivos pueden confundir alguna de las palabras que decimos mientras hablamos y activarse al detectarlas sin tener en cuenta el contexto, podremos obligar a Alexa a activarse solo cuando pulsamos un botón físico de activación.
También podremos activar un tono de aviso que nos permita saber cuándo comienza y termina esa grabación e incluso "silenciar" el dispositivo, aunque obviamente eso hará que no podamos disfrutar de sus prestaciones.
Siri en Apple
¿Qué recolecta, y con qué fin?
Siri fue el primer asistente de voz en aparecer en el mercado de forma masiva en 2015 gracias a su integración en el iPhone. El asistente recolecta y utiliza información que tenemos en el móvil tal y como nuestro nombre o nuestros contactos.

Si además tenemos habilitados los servicios de localización, dicha información puede ser enviada con la petición que le hacemos al asistente para que la respuesta sea más precisa.
En Apple especifican además que algunas características de Siri hacen necesaria "la entrada de datos en tiempo real desde los servidores de Apple", lo que por ejemplo Siri recolectaría tanto nuestra ubicación actual como nuestro destino si le estamos pidiendo la ruta entre dos puntos en Apple Maps, por ejemplo.
¿Dónde se guardan esos datos y qué control tenemos sobre esos datos?
Cuando hablamos con Siri, esos comandos se envían a los servidores de Apple para el análisis. En ese proceso Apple asigna un número aleatorio con esa grabación, que asocia a nuestros ficheros de voz.

Tras seis meses desde esa grabación o si desactivamos Siri, Apple "desconecta" ese número aleatorio de nuestro registro de grabaciones, lo que hace que básicamente elimine la asociación quee existía. Esos ficheros se almacenan durante otros 18 meses desde ese momento porque Apple puede usarlos para potenciales pruebas y mejora de sus productos.
Ese tratamiento de las grabaciones hace que el caso de Apple sea también distinto a la hora de permitir qué puede controlar el usuario. Podremos desactivar los servicios de localización desactivar Siri o desconectar la espera activa para que el asistente solo opere con un comando físico.
Sin embargo no hay un acceso a esas grabaciones como ocurre por ejemplo con Google Assistant o Amazon Echo. Podremos, eso sí, borrar todo el historial de esa interacción de voz de los servidores de Apple, pero para ellos tendremos que desactivar el dictado de voz desde los ajustes de nuestro dispositivo.
Es posible no obstante reclamar a Apple todos los datos que tiene sobre nosotros, algo que se hace desde la página de ID de Apple. Si iniciamos sesión —nos pedirá responder a dos preguntas de seguridad— podremos acceder en la parte baja de la página a la sección "Gestiona tus datos y tu privacidad", lo que nos llevará a la página específica de Apple para este apartado
Desde allí ya podremos solicitar una copia de nuestros datos, aunque en ellos no se incluyen como tales los ficheros de audio que podríamos esperar recuperar: el citado procesamiento de esos ficheros hace que por lo visto no sea posible recuperar dichas grabaciones.
Cortana en Microsoft
¿Qué recolecta, y con qué fin?
El desarrollo de Microsoft comenzó su andadura en dispositivos móviles, pero el fracaso de Windows Mobile y Windows 10 en smartphones ha hecho que Cortana haya dado el salto a equipos de escritorio —está integrado en Windows 10— y en algunos altavoces inteligentes.

Al utilizar Cortana se recolectará información sobre nuestro dispositivo, los servicios de Microsoft que utilicemos y también servicios de terceras partes con los que conectemos usando Cortana. En Microsoft aseguran que "Cortana no usa los datos que comparta con ella para dirigirte publicidad"
Como indican los términos de privacidad de Cortana, entre los datos recolectados está el historial de navegación, el calendario, los contactos, el historial de ubicación o incluso —y esto es algo preocupante— "el historial de contenidos y comunicaciones de mensajes, aplicaciones y notificaciones".
Si utilizamos Cortana como parte de una sesión en Windows con nuestra cuenta en dicha plataforma, esas grabaciones que se realicen quedarán asociadas a dicha cuenta, y es a partir de ahí que podremos controlar dichos datos recolectados.
¿Dónde se guardan esos datos y qué control tenemos sobre esos datos?
En Microsoft cuentan también con una amplia infraestructura de servidores —Azure es una plataforma cada vez más importante para la empresa de Redmond— en los que almacenan todos esos datos recolectados.

Si queremos acceder a la descarga de los datos que Microsoft tiene almacenados sobre nosotros al usar Cortana, podremos hacerlo desde nuestro equipo basado en Windows. En la Configuración podremos ir a "Cortana->Permisos e historial", lo que nos permitirá —si usamos Cortana regularmente y hemos iniciado sesión, no es mi caso— "cambiar lo que Cortana sabe de mí en la nube".
También podremos tener acceso a todos esos datos de voz almacenados por Microsoft yendo al panel de privacidad de nuestra cuenta, lo que nos llevará a una serie de opciones entre las que estarán las búsquedas e interacciones de voz.
En Microsoft explican que en el panel "no se muestran todos tus datos", ya que la empresa "elimina rutinariamente datos que nuestros sistemas ya no necesitan". Desde ese panel también podremos controlar a qué servicios de terceras partes damos acceso a conectar con Cortana, por ejemplo.
El panel de control que Microsoft ofrece para Cortana es más completo que el del resto de alternativas, y hasta cierto punto permite mantener cierto equilibrio entre las capacidades del asistente de voz y los datos que recolecta durante nuestro uso del mismo.
Conclusiones: los asistentes escuchan, pero el usuario tiene el control (si quiere)
La avalancha de servicios y productos relacionados con los asistentes de voz hace que las suspicacias sobre la seguridad y privacidad que ofrecen estos dispositivos sean inevitables.

Como ya ocurre con otros muchos servicios que recolectan datos mientras navegamos por internet, esa ambición por recoger más y más información sobre los usuarios se extiende también a estos asistentes de voz.
Aquí, como en otros muchos escenarios que afectan a nuestro uso rutinario de la tecnología, es importante tener estar informados de lo que se recolecta con esos servicios, pero también ser conscientes de que disfrutar de esas prestaciones conlleva ciertos compromisos. Cada uno elige si el sacrificio le compensa y si esa recolección de datos no le resulta problemática.
Lo sea o no, afortunadamente estamos en un momento en el que las empresas tecnológicas se han visto obligadas a mejorar de forma notable las herramientas que dan acceso a los usuarios a sus datos recolectados, y eso no es excepción para los asistentes.
Apple no ofrece un control tan directo pero su enfoque es válido, y precisamente son las otras tres —Google, Microsoft y Amazon— las que más sospechas podrían levantar por ese "hambre de datos" que muestran en muchos de sus productos y servicios. Lo hacen porque ciertamente de esos datos depende tener cierta ventaja competitiva —una publicidad más efectiva, por ejemplo— pero esto no es nuevo en un segmento exageradamente ávido de esa recolección.
La transparencia de estos servicios es cada vez mayor, aunque como siempre depende del usuario controlar con mayor o menor acierto esa recolección de datos. Unos datos que, no lo olvidemos, salvo en el caso de Apple permanecen de forma indefinida en los servidores de estas tecnológicas. Podremos borrarlos cuando lo deseemos, pero para eso debemos mostrarnos proactivos. Esa es otra guerra muy distinta, pero saber hasta qué punto estamos expuestos es un buen punto de partida.








No hay comentarios:

Publicar un comentario