Noticias Tecnología: "Qué es lo que realmente escuchan, almacenan y procesan Alexa, Assistan y Siri."

30 Noviembre 2018 - Actualizado 2 Diciembre 2018, 23:08

Qué es lo que realmente escuchan,
almacenan y procesan Alexa, Assistant y Siri.

Los asistentes de voz están de moda. Los altavoces inteligentes de Amazon o de Google se han convertido en uno de los potenciales regalos estrella de estas navidades, y ahora tanto el asistente de Google como Alexa o Siri hablan español es conveniente hacerse una pregunta: ¿qué escuchan y guardan de todo lo que hablamos alrededor de ellos?

La privacidad vuelve a estar en tela de juicio ante unas soluciones que algunos podrían pensar que nos "espían", pero como veremos a continuación todas las empresas responsables del desarrollo de asistentes de voz han tenido muy en cuenta este apartado y cuidan muy mucho los datos que se manejan y cómo se manejan.

Las máquinas quieren hablar con nosotros

Los altavoces inteligentes dan un poquito de miedo. No ya por errores anecdóticos que provocaron aquellas risas siniestras sino porque al utilizarlos no queda claro qué tipo de efectos colaterales tiene esa interacción con estos dispositivos.

Estamos rodeados de tecnología que nos escucha, pero no contentos con llevar el móvil en todas partes ahora los altavoces inteligentes también nos acompañan en el hogar, y no es el único elemento en el que los asistentes de voz está presente. Los relojes inteligentes y diversas soluciones que podríamos englobar dentro del segmento de la Internet de las cosas también pueden hacer uso de estos desarrollos.

El problema (si es que lo consideramos así) está en esa sensación de que estos productos siempre están escuchándonos, lo que amenaza la seguridad de nuestros datos y nuestra privacidad. Ocurrió por ejemplo con aquella conversación privada que un Amazon Echo acabó compartiendo con un contacto aleatorio por error, pero este tipo de situaciones son la excepción, no la regla.

En cierta forma es como si los asistentes de voz estuvieran siempre vigilándonos, aunque en realidad los fabricantes ponen a nuestra disposición bastante información para entender qué hacen estos asistentes con esos datos.

Así funcionan los asistentes de voz

Tanto los altavoces inteligentes como el resto de productos que aprovechan la capacidad de los asistentes de voz funcionan de una forma similar: se activan a través de una palabra que los despierta, lo que significa que dichos asistentes están en espera activa: siempre escuchan, pero solo prestan atención a partir del momento en el que escuchan esa palabra esoecial ("Hey Siri", "OK Google", etc) o pequeña frase de activación.

Para poder realizar esa función de espera activa estos asistentes no paran de escucharnos y realizar pequeñas grabaciones con esas palabras que escuchan y que tratan de reconocer. Si se detecta esa palabra o frase de activación, el dispositivo mantiene la grabación para procesarla, pero si no lo es esa grabación se elimina.

Una vez activamos el asistente de voz, eso sí, empieza la transferencia de datos, y aquí es importante señalar que una vez más dependemos de la nube: esa conversación y esas preguntas u órdenes no se procesan en el dispositivo como tal, sino que se transfieren a un servidor que las interpreta, las procesa y da la respuesta que nuestro asistente simplemente se encarga de ofrecernos de viva voz (sintetizada, claro).

Por lo tanto nuestra voz no se almacena en local en el dispositivo, sino que acaba en los servidores que los fabricantes de estos dispositivos y desarrolladores de estos asistentes (Google, Apple, Amazon, Microsoft) tienen preparados para toda esa ingente labor de reconocimiento del lenguaje.

Pero ¿qué datos se transfieren realmente a esos servidores? ¿Qué hacen esas empresas con esos datos? ¿Qué podemos hacer nosotros al respecto? Eso es lo que creemos importante aclarar, y lo haremos por separado para cada uno de los cuatro grandes asistentes de voz del mercado actual.

Asistente de Google

¿Que recolecta, y con qué fin?

Es importante destacar que el asistente de voz presente por ejemplo en Google Home no graba todas nuestras conversaciones. En lugar de uso el asistente "escucha pequeños fragmentos" de pocos segundos para detectar si se ha pronunciado la frase de activación. Si no es así, esos fragmentos se eliminan "y nada de esa información abandona tu dispositivo hasta que se escucha la frase de activación".

La ayuda de Google Home nos informa sobre la información que se recoge los dispositivos de la familia Google Home. De hecho existe un apartado específico que muestra los datos recolectados, y que se dividen en tres grupos.

En el primero están los datos destinados a mejorar el rendimiento y fiabilidad del dispositivo como la estabilidad de la red-WiFi, el porcentaje de éxito de la detección o la latencia, entre otros.

El segundo grupo es el que engloba las estadísticas de uso, como por ejemplo el número de interacciones en el dispositivo y qué botones pulsamos en los asistentes. También se recolectan la duración de las sesiones miltimedia y qué aplicaciones utilizamos en esas sesiones, pero aquí es importante destacar que en Google "no recogemos información sobre el contenido que se reproduce, pero es posible que el proveedor de servicios multimedia nos lo indique".

En el tercer grupo de datos recolectados están la información sobre el modelo de hardware y la revisión de software que utilizamos, pero también los procesos activos para poder establecer las posibles causas de fallos en los informes de error.

En esa ayuda también se explica cómo el asistente de Google integrado en Google Home puede acceder al historial de búsqueda "para ofrecerte respuestas mejores y más útiles", y aunque puedes darle tu dirección a Google, puedes no hacerlo, en cuyo caso el sistema "averiguará tu ubicación aproximada según tu dirección IP y otras señales para definir las alarmas en la zona horaria correcta y ofrecerte información meteorológica y sobre el tráfico relevante".

La empresa recolecta datos con el objetivo de hacer sus servicios "más rápidos, más inteligentes, más relevantes y más útiles para los usuarios", y por lo visto esa actividad con estos asistentes permite que Google Home aprenda "con el paso del tiempo, a ofrecer respuestas y sugerencias mejores y más personalizadas".

¿Dónde se guardan esos datos y qué control tenemos sobre esos datos?

Esos datos que se transfieren a los servidores de Google pasan por tanto a sus centros de datos, donde se guardan de forma indefinida a no ser que los eliminemos manualmente.

Precisamente ahí es donde entran las herramientas que Google ofrece para controlar esa actividad y esa gestión de datos. En Mi Actividad contamos con un panel de control completo en el que podremos consultar la información que Google guarda sobre nuestro uso de sus servicios, incluyendo por supuesto a los relacionados con su asistente de voz.

Es en ese panel en el que podremos encontrar todos los clips de audio que se han grabado con nuestras peticiones a estos asistentes filtrando los resultados por los que solo coincidan con "Voz y Audio". Será allí donde encontraremos las grabaciones de nuestras frases, que podremos eliminar junto a cualquier otra información que no queramos que se almacene en esos servidores.

Alexa en Amazon

¿Qué recolecta, y con qué fin?

Como sucede con el resto de asistentes, Alexa recolecta nuestras conversaciones, peticiones y órdenes de voz. Amazon las registra y procesa esa información que además puede en algunos casos ser compartida con terceras partes.

Este asistente de voz en realidad empieza a grabar "una fracción de segundo del audio" antes de que se pronuncie la palabra o frase de activación (o pulsamos un botón que active el asistente), y es entonces cuando emite esa grabación a los servidores de Amazon.

En Amazon indican que cuando usamos un dispositivo basado en Alexa, se quedan con esas grabaciones "para mejorar la precisión de los resultados proporcionados y para mejorar nuestros servicios". Como en el resto de los servicios, "eliminar esas grabaciones puede degradar tu experiencia al usar el dispositivo".

¿Dónde se guardan esos datos y qué control tenemos sobre esos datos?

Amazon cuenta con una de las infraestructuras más importantes en todo el mundo a nivel de servidores y centros de datos: no en vano su división de Amazon Web Services es una de las claves de su negocio.

Cualquier usuario de Alexa puede acceder a esas grabaciones de voz desde la aplicación de Alexa (en el apartado de privacidad) o bien en la dirección web que ofrece Amazon. Desde allí es posible eliminar esas grabaciones, aunque mientras se procesan esas peticiones podremos seguir revisando las grabaciones de voz y reproducirlas.

Una de las peculiaridades de este panel de control es que podremos también controlar los permisos que hemos concedido a otros servicios y aplicaciones que se conectan a Alexa. Es aquí donde entran en juego los "Skills", esas capacidades extra que Amazon lleva impulsando desde hace tiempo para dar más versatilidad a este asistente de voz.

En esas preferencias también podremos establecer más restricciones al uso del asistente. Dado que los dispositivos pueden confundir alguna de las palabras que decimos mientras hablamos y activarse al detectarlas sin tener en cuenta el contexto, podremos obligar a Alexa a activarse solo cuando pulsamos un botón físico de activación.

También podremos activar un tono de aviso que nos permita saber cuándo comienza y termina esa grabación e incluso "silenciar" el dispositivo, aunque obviamente eso hará que no podamos disfrutar de sus prestaciones.

Siri en Apple

¿Qué recolecta, y con qué fin?

Siri fue el primer asistente de voz en aparecer en el mercado de forma masiva en 2015 gracias a su integración en el iPhone. El asistente recolecta y utiliza información que tenemos en el móvil tal y como nuestro nombre o nuestros contactos.

Si además tenemos habilitados los servicios de localización, dicha información puede ser enviada con la petición que le hacemos al asistente para que la respuesta sea más precisa.

En Apple especifican además que algunas características de Siri hacen necesaria "la entrada de datos en tiempo real desde los servidores de Apple", lo que por ejemplo Siri recolectaría tanto nuestra ubicación actual como nuestro destino si le estamos pidiendo la ruta entre dos puntos en Apple Maps, por ejemplo.

¿Dónde se guardan esos datos y qué control tenemos sobre esos datos?

Cuando hablamos con Siri, esos comandos se envían a los servidores de Apple para el análisis. En ese proceso Apple asigna un número aleatorio con esa grabación, que asocia a nuestros ficheros de voz.