Los rumores de dispositivos inteligentes que escuchan a escondidas han estado circulando durante muchos años. Sin duda, has escuchado un par de historias sobre personas que estaban hablando, por ejemplo, de la nueva máquina de café en el trabajo y recibieron un bombardeo de anuncios en línea, exacto, de máquinas de café. Ya probamos esta hipótesis y hemos llegado a la conclusión de que estas empresas no escuchan a escondidas; tienen muchas otras formas menos dramáticas pero mucho más efectivas de dirigir los anuncios. Pero quizás los tiempos están cambiando. Hace poco se supo (aquí y aquí) de dos empresas de marketing que supuestamente se jactaban de ofrecer anuncios dirigidos sobre la base de esas escuchas. Por supuesto, ambas empresas después se retractaron y eliminaron las respectivas declaraciones de sus sitios web. Sin embargo, decidimos echar un vistazo a la situación.
Lo que afirmaban las empresas
En llamadas con clientes, pódcasts y blogs, CMG y Mindshift contaron casi la misma historia, aunque sin detalles técnicos: los teléfonos y televisores inteligentes supuestamente las ayudan a reconocer palabras clave predeterminadas en las conversaciones de las personas, que después se utilizan para crear audiencias personalizadas. Estas audiencias, en forma de listas de números de teléfono, direcciones de correo electrónico e ID de publicidad anónima, se pueden cargar en varias plataformas (desde YouTube y Facebook hasta Google AdWords y Microsoft Advertising) y utilizarse para dirigir los anuncios a los usuarios.
Aunque la segunda parte sobre la carga de audiencias personalizadas suena bastante verosímil, la primera es más que confusa. A partir de las declaraciones de las empresas, no queda para nada claro qué aplicaciones y tecnologías utilizan para recopilar información. Pero, en la extensa publicación de blog (que se eliminó), se destacó el siguiente pasaje sin tecnicismos: “Sabemos lo que estás pensando. ¿Acaso esto es legal? Es legal que los teléfonos y dispositivos te escuchen. Cuando, al descargar o actualizar una nueva aplicación, se solicita a los consumidores que acepten condiciones de uso de varias páginas, en algún lugar de la letra pequeña a menudo se incluye la escucha activa”.
Después de la hostigación de los periodistas, CMG eliminó la publicación de su blog y emitió una disculpa/aclaración, en la que añadió que no se realizan escuchas y que los datos de segmentación “provienen de las redes sociales y otras aplicaciones”.
La segunda empresa, Mindshift, solo borró todos los mensajes de marketing de su sitio web sobre esta forma de publicidad sin decir palabra.
¿En qué mintieron?
Claramente, los publicistas se “expresaron mal” frente a sus clientes al prometerles anuncios activados por voz o frente a los medios de comunicación. Lo más probable es que fuera lo primero; he aquí por qué:
- Los sistemas operativos modernos indican claramente cuando una aplicación legítima usa el micrófono. Además, en todos los sistemas operativos más conocidos, si, por ejemplo, alguna aplicación del clima escucha constantemente el micrófono, en espera de que las palabras “máquina de café” salgan de tu boca, el icono del micrófono se ilumina en el panel de notificaciones.
- En los teléfonos inteligentes y otros dispositivos móviles, las escuchas agotan la batería y consumen los datos. Esto se haría notar y provocaría una oleada de odio.
- El análisis constante de las transmisiones de audio de millones de usuarios requeriría una potencia informática enorme y sería una locura financiera, ya que las ganancias publicitarias nunca podrían cubrir los costes de tal operación de segmentación.
A pesar de la creencia popular, los ingresos anuales de las plataformas publicitarias por usuario son bastante bajos: menos de 4 $ en África, alrededor de 10 $ en promedio en todo el mundo y hasta 60 $ en los EE. UU. Dado que estas cifras se refieren a los ingresos, no a las ganancias, simplemente no queda dinero para escuchar a escondidas. Se invita a los escépticos a estudiar, por ejemplo, el precio del reconocimiento de voz de Google Cloud: incluso a la tarifa mayorista con más descuento (más de dos millones de minutos de grabaciones de audio al mes), la conversión de voz a texto cuesta 0,3 centavos por minuto. Suponiendo que hay un mínimo de tres horas de reconocimiento de voz por día, el cliente tendría que gastar alrededor de 200 $ por año en cada usuario individual, que es demasiado incluso para las empresas de publicidad estadounidenses.
¿Y los asistentes de voz?
Dicho esto, el razonamiento anterior puede no ser cierto para los dispositivos que ya escuchan comandos de voz debido a su finalidad principal. En primer lugar, están los altavoces inteligentes, así como los teléfonos inteligentes con asistentes de voz encendidos permanentemente. Los dispositivos menos obvios son los televisores inteligentes que también responden a comandos de voz.
Según Amazon, Alexa siempre está a la espera de la palabra de activación, pero solo graba y envía datos de voz a la nube al escucharla y se detiene apenas termina la interacción con el usuario. La empresa no niega que los datos de Alexa se utilicen para dirigir anuncios, y hay estudios independientes en los que se confirma esto. Algunos usuarios consideran que esa práctica es ilegal, pero la demanda que presentaron contra Amazon aún está en curso. Mientras tanto, otra acción que inició la Comisión Federal de Comunicaciones de EE. UU. contra Amazon resultó en un modesto acuerdo de 30 millones de dólares. Se ordenó al gigante del comercio electrónico que pagara por no eliminar los datos que recopila Alexa sobre los niños, una violación directa de la Ley de Protección de la Privacidad Infantil en Línea (Children’s Online Privacy Protection Act, COPPA) de EE. UU. La empresa también tiene prohibido utilizar estos datos recopilados ilegalmente para necesidades comerciales, en particular, para entrenar algoritmos.
Y durante mucho tiempo ha sido un secreto a voces que otros proveedores de asistentes de voz también recopilan datos de interacción con el usuario: esta es la verdad sobre Apple y Google. De vez en cuando, personas reales escuchan estas grabaciones para resolver problemas técnicos, entrenar nuevos algoritmos, etc. ¿Pero se utilizan para dirigir anuncios? En algunos estudios, se confirman esas prácticas por parte de Google y Amazon, aunque se trata más de un caso de uso de la búsqueda por voz o el historial de compras en lugar de escuchas constantes. En cuanto a Apple, en ningún estudio se encontró un vínculo entre los anuncios y Siri.
No encontramos un estudio dedicado a los comandos de voz de los televisores inteligentes, pero se sabe desde hace mucho tiempo que los televisores inteligentes recopilan información detallada sobre lo que ven los usuarios, incluidos datos de vídeo de fuentes externas (reproductor de discos Blue-ray, ordenadores, etc.). No se puede descartar que las interacciones de voz con el asistente integrado también se utilicen más de lo que quisieras.
Caso especial: spyware
También hay una verdadera escucha a escondidas de teléfonos inteligentes, pero, en este caso, no se trata de vigilancia masiva con fines publicitarios, sino de espionaje dirigido a una víctima específica. Hay muchos casos documentados de ese tipo de vigilancia, cuyos autores pueden ser parejas celosas, competidores comerciales e incluso agencias de inteligencia fidedignas. Pero este tipo de escuchas requiere la instalación de malware en el teléfono inteligente de la víctima y, a menudo, “gracias” a las vulnerabilidades, esto puede suceder sin que el objetivo haga nada. Una vez que un teléfono inteligente está infectado, las opciones del atacante son casi ilimitadas. Tenemos una serie de publicaciones dedicadas a estos casos: lee sobre stalkerware, modificaciones de servicios de mensajería instantánea infectadas y, por supuesto, la saga épica de nuestro descubrimiento de Triangulation, quizás el troyano más sofisticado para dispositivos Apple que exista. Ante tales amenazas, la precaución por sí sola no es suficiente: se necesitan medidas específicas para mantener el teléfono inteligente seguro, como instalar una solución de protección fiable.
Cómo protegerse de las escuchas
- Desactiva el permiso del micrófono en teléfonos inteligentes y tabletas para todas las aplicaciones que no lo necesiten. En las versiones modernas de los sistemas operativos móviles, en el mismo lugar donde está la administración de permisos y privacidad, puedes ver qué aplicaciones usaron el micrófono del teléfono (y otros sensores) y cuándo. Asegúrate de que no haya nada sospechoso o inesperado en esta lista.
- Controla qué aplicaciones tienen acceso al micrófono en el ordenador. La configuración de permisos en las versiones más recientes de Windows y macOS es muy similar a la de los teléfonos inteligentes. También puedes instalar una protección fiable en el ordenador para evitar que te espíen a través de malware.
- Analiza la opción de desactivar el asistente de voz. Aunque no escucha todo el tiempo, algunos fragmentos no deseados pueden terminar en las grabaciones de tus conversaciones con el asistente. Si te preocupa que las voces de tus amigos, familiares o compañeros de trabajo puedan llegar a los servidores de corporaciones globales, usa el teclado, el ratón y la pantalla táctil.
- Desactiva el control por voz en el televisor. Para que sea más fácil escribir nombres, conecta un teclado inalámbrico compacto al televisor inteligente.
- Despídete de los altavoces inteligentes. Para aquellas personas a quienes les gusta reproducir música en altavoces mientras leen recetas y pican verduras, este es el consejo más difícil de seguir. Un altavoz inteligente es prácticamente el único dispositivo capaz de escucharte a escondidas todo el tiempo. Por lo tanto, tendrás que vivir con ese riesgo o encenderlo solo cuando cortes verduras.