La portada de mañana
Acceder
La guerra entre PSOE y PP bloquea el acuerdo entre el Gobierno y las comunidades
Un año en derrocar a Al Asad: el líder del asalto militar sirio detalla la operación
Opinión - Un tercio de los españoles no entienden lo que leen. Por Rosa María Artal

Data doubles: ¿eres quien tus datos dicen que eres?

La minería de datos (data mining) es el proceso por el cual se recogen y analizan diferentes datos con el fin de obtener información útil. Que una persona cumpla 18 años es información relativamente útil, pero si se logra cruzar ese cumpleaños con personas matriculadas en autoescuelas, el resultado constituye un público objetivo óptimo para la recepción de anuncios sobre novedades en el sector del automóvil. Si una empresa accede a esas dos bases de datos (fecha de nacimiento y matriculación en autoescuelas), la venta del fichero resultante tiene un alto valor para el potencial anunciante de coches, que entiende que el impacto de cualquier mensaje publicitario será así mucho mayor.

Ésta es la explicación “sencilla” del data mining, y la que hace que el sentido común lleve a muchos a la conclusión de que los procesos de recogida de datos y creación de perfiles tiene un alto valor comercial y es un mercado de futuro. El modelo de negocio de muchas redes sociales se basa precisamente en esta idea: dispongo de tantos datos de mis usuarios que puedo conseguir que éstos reciban el anuncio que necesitan antes casi de que sepan que desean adquirir un nuevo producto o servicio. Adelantarse a las necesidades del consumidor es el sueño húmedo de toda empresa y la promesa de la minería de datos.

Pero como ocurre con todo lo tecnológico, el sentido común es mal compañero de viaje. Más que nada porque a la mayoría nos falta información para llegar a conclusiones informadas. En este caso, sobre las circunstancias que pueden llevar a la distorsión de los perfiles elaborados en base al data mining, sobre los problemas de seguridad y privacidad, y sobre los otros usos de los datos recolectados.

Perfiles distorsionados

Perfiles distorsionadosEs útil de vez en cuando intentar entender qué dice nuestro perfil en algunas de las redes sociales y aplicaciones que utilizamos, reconstruyéndolo en base a los anuncios o promociones que nos llegan. Uno mismo puede hacer varios experimentos y ver cómo inmediatamente cambia su perfil: es fácil ver que si una cambia su estado civil de soltera a casada en Facebook, inmediatamente los anuncios pasan de ‘donación de óvulos’ y servicios de online dating a promociones de fines de semana románticos y casetas para perro.

Este es un caso real realizado en mi propio Facebook al introducir un cambio ficticio de estado civil, y lo sorprendente fue ver que de toda mi información personal vertida en Facebook, lo único que los algoritmos parecieron procesar de forma inmediata y evidente fue esa supuesta boda. Igualmente, hace años compré en Amazon una cámara de vídeo para un amigo, y hasta el día de hoy recibo anuncios de accesorios que ni sé utilizar ni tengo intención de comprar.

La cuestión es que los algoritmos que tratan nuestros datos tienen aún mucha más facilidad para procesar cosas simples como el estado civil que elementos más complejos como nuestros sentimientos u opiniones políticas. Además, el lucro de la minería de datos reside no en los perfiles personales, sino en las categorías. Los anuncios personalizados no son (aún, quizás) rentables; lo que se vende caro son largas listas de personas que cumplen ciertas características y son por eso más receptivas (potencialmente) a ciertos mensajes.

Lo gracioso es que las categorías están pre-establecidas, con lo que acabamos formando parte de un perfil ‘típico’ que no siempre encaja con nuestra personalidad –y menos aún si, como hacemos muchos, jugamos aleatoriamente con datos falsos y verdaderos. Si estuviera casada no sé si tendría perro, pero es que ni lo estoy ni lo tengo. FAIL.

Víctimas de los data doubles

Víctimas de los data doublesdata doublesQue algunas de las aplicaciones que utilizamos sean un poco patosas a la hora de reflejar quiénes somos puede hacer que parezca que los fallos de la minería de datos son algo trivial. Pero nada más lejos de la realidad. Los datos personales que compartimos construyen versiones de cada uno de nosotros en el mundo virtual –lo que llamamos data doubles. Estas personalidades paralelas son las que utilizan las redes sociales y las tiendas online para ajustar sus productos a nuestras supuestas preferencias. Pero también son utilizadas por bancos, compañías de seguros y empleadores. Nuestro data double puede determinar cosas tan sensibles como si se nos concede un créditodata double, si el seguro nos cubre en caso de eventualidad o enfermedad, o si somos empleables por parte de esa empresa que llevamos días esperando a que nos llame con una oferta. Decisiones importantísimas en ámbitos vitales clave como el trabajo o la salud pueden depender de los datos que nosotros hayamos compartido o que los servicios que utilizamos hayan ‘minado’ y analizado.

Lo grave en estos casos es que nuestros data doubles se construyen casi siempre a nuestras espaldas, sin que sepamos qué dicen de nosotros ni tengamos medios para rectificar o cancelar la información que reproducen sobre nosotros, aunque sea incierta o no nos refleje fielmente. Por eso, paralelamente a los derechos de acceso, rectificación y cancelación que nuestros datos personales que prevé la Ley Orgánica de Protección de Datos española, emerge también el complementario Derecho al Olvido. Sin embargo, en un marco de intercambio global de datos, las legislaciones nacionales y regionales a menudo nos dejan sin herramientas para defender derechos fundamentales (intentad si no ejercer el derecho de acceso en Google, por ejemplo).

Privacidad, seguridad y minería

Privacidad, seguridad y mineríaAl final, la recolección masiva de datos personales de los ciudadanos avanza en un escenario de desconocimiento generalizado de su alcance e impacto, sin un marco regulador adecuado y creando avenidas de intercambio de información personal que son fácilmente intervenibles (hackeables) y por lo tanto inseguras, como muestra el robo rutinario de datos en grandes y pequeñas empresas.

Al final, centrar el debate en una versión soft de la privacidad ignora que las consecuencias de la minería de datos pueden ser profundísimas, en forma de robo o mala gestión de esos datos, y afectar de forma concreta a nuestras posibilidades económicas y vitales.

Es urgente, pues, una doble aproximación a la minería de datos: por una parte es importante cuestionar las afirmaciones panópticas de la industria, que asegura ser capaz de crear data doubles perfectos y de avanzarse a nuestras preferencias para sí aumentar el valor de cambio de sus grandes bases de datos cruzadas y sus rudimentarios algoritmos.

Pero por otra, es clave advertir de que la minería de datos no sólo genera riesgos más o menos triviales, sino que puede afectar profundamente a nuestras oportunidades y opciones como personas, a derechos civiles y fundamentales y a nuestra dignidad e integridad.

Así que no hace falta que cunda el pánico, pero tampoco es necesario que sigamos caminando por el universo de datos con un lirio en la mano. Cada vez que nos emocionemos con las posibilidades del Big Data o las tecnologías smart, mejor recordar que hablamos de procesos que generan valor en base al uso masivo y no siempre responsable de datos personales que mañana pueden alterarnos significativamente la vida. Ni más ni menos.