Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.

Cuando el Big Data se convierte en Big Brother

Instalación de la exposición Big Bang Data en el CCCB / Knechtel Photograpy

Sintetia

Andrés Alonso —

¿Recuerdan El Show de Truman? Fabulosa película de ciencia ficción en la que se muestra el extremo de la comercialización de la vida de terceras personas mediante el formato televisivo del reality show. En esta película [atención, spoiler] toda la vida de Truman Burbank (interpretado por Jim Carrey) está diseñada desde un Gran Hermano que le cuida y le dirige, sin él saberlo.

¿Estamos acercándonos a este nivel de control y observación? Desde luego hay dos experimentos de dos importantes grupos de analistas de datos (perdón, data scientists) que apuntan en esta dirección, al concluir ambos rotundamente algo en común: todo usuario en Internet es parte de un experimento.

La herramienta básica de todo experto en usabilidad web son los test A/B, pruebas aleatorizadas en las que a un grupo de usuarios se les muestra una página con un cambio, y a otro grupo sin dicho cambio, y se observa el impacto en el rendimiento de la página del mismo mediante este experimento natural, artificialmente construido. De hecho, ahora mismo si quisiéramos saber si este artículo es más veces compartido en redes sociales si cambiamos el número de párrafos en que se divide (por ejemplo), el enfoque estadísticamente correcto (y que ya se hace) sería presentarlo aleatoriamente en ambas versiones a grupos de lectores aleatoriamente seleccionados y analizar su respuesta.

Así, todo usuario de alguna aplicación online forma parte tarde o temprano de un experimento; veamos los dos ejemplos más llamativos y recientes, el primero en Facebook y el segundo en OKCupid (una aplicación de citas online).

Existe la envidia online

Este año hemos conocido los resultados de un estudio de 2012 en el que un grupo de investigadores de Facebook propuso un experimento (Experimental evidence of massive-scale emotional contagion through social networks) sobre la capacidad de la red social de influir en las emociones de los usuarios. A un grupo de usuarios se les seleccionó aleatoriamente, y en su muro se les mostró sólo las noticias negativas que escribían sus contactos, y se midió su estado de ánimo mediante los mensajes que ellos mismos mostraban en su perfil. Conclusión: hay evidencia de que la envidia online existe. Vivimos en la era 2.0, somos permeables y si nos muestran mensajes negativos, nos contagiamos.

¿Cómo de horripilante es esto? Quizás no tanto. En el fondo, volvamos a los A/B tests: todo usuario es un experimento, el caso es si somos capaces de medirlo o no.

En cuestión de amor, nos dejamos influenciar

OKCupid recientemente ha disfrutado con los resultados de un experimento en el que se evidencia que en los perfiles de esta plataforma de citas online lo único que realmente importa es la foto que sus usuarios ponen. ¿Sorprendidos? Posiblemente no, pero, desde luego, el experimento (aleatorizado) ha tenido su miga. Incluyeron perfiles falsos, sin texto en sus perfiles, y vieron su éxito en el número de veces que “gustaban” a la comunidad. De hecho, afirman que quitaron su rating de personalidad porque estadísticamente no aportaba valor añadido a la información que ya se podía inferir con la foto de perfil.

Pero por si esto fuera poco, midieron la sensibilidad de las personas a la recomendación (supuestamente derivadas de su algoritmo de afinidad) de la plataforma en los contactos realizados. Cuando manualmente probaron a dar recomendaciones de afinidad entre usuarios que no eran según el algoritmo afines, este consejo de OKCupid surtía efecto realmente: ¡si me recomiendan, me lo creo! Obviamente, cuando los ratings de afinidad eran muy diferentes los contactos eras más cortos, pero aun así, consiguieron un resultado positivo en el manejo de emociones.

¿Podemos hablar ya de ética en relación a los datos masivos?

Para opiniones hay colores, y hay quien se llevará un disgusto al saber que con la cantidad inmensa de datos que aportamos a la web, los analistas (en nombre de las empresas) pueden no solo medirnos, sino influirnos. Y es que no hablamos de seguridad de la información, ni control de nuestros datos. Hablamos de la explotación de los mismos para optimizar nuestro propio comportamiento (nudge).

En una primera instancia, podríamos pensar que es vanidoso pensar que nuestros datos son importantes para las empresas en un sentido individual, ya que en realidad nuestros datos solo importan a la hora de estimar con mayor precisión el comportamiento medio de un grupo de individuos (sea tanto la media global como la media clusterizada). Pero ¿en qué medida es esto así? Corremos peligro de caer en una manía persecutoria del big data, pero, desde luego, el Big Data se está desarrollando tanto y tan velozmente que es momento de que esta disciplina incluya una vertiente ética. ¿Hay límites al control del individuo a partir del dato que este mismo genera?

Etiquetas
stats