Un tuit tiene mucho más de 140 caracteres
Los datos son el contenido de una comunicación. Los metadatos son la información extra que se genera en el proceso. Lo hace de manera automática y oculta, sin avisar. Cada foto que hacemos, cada texto que cortipegamos, cada correo que enviamos está lleno de información oculta. Esa información no solo es reveladora, también es sustanciosa. En ningún otro contexto se manifiesta esta extraña realidad inversa como en un tuit.
Aunque Twitter sólo permite publicar 140 caracteres cada vez, cada actualización incluye un contingente de datos que revelan aspectos de nuestra identidad, localización, tecnología y contexto. Como muestra, este documento que se le escapó a Raffi Krikorian, responsable de toda la infraestructura interna de Twitter hasta Agosto de 2014.
Como una garrapata capaz de contener hasta 120 veces su propio peso en sangre ajena, cada vez que publicamos un actualización sobre nuestra serie favorita o nos alimentamos el odio ninguneando públicamente a un político, estamos informando de quiénes somos, cuánta gente nos sigue, con qué sistema operativo trabajamos o desde qué barrio. Y no sólo informamos a Twitter. Cualquier compañía haciendo análisis de datos del tráfico de Twitter es capaz de aprovechar esa información de muchas maneras distinta. Casi siempre con fines comerciales, pero no necesariamente.
Como apuntaba la empresa de minería de datos Elasticsearch -hoy Elastic.co- a Elizabeth Dwoskin en el Wall Street Journal, podemos determinar a cuánta gente en una determinada área le ha gustado un producto y cómo evoluciona en el tiempo, o qué impacto ha tenido un tuit en un sector de la población. MapBox usa los metadatos de millones de usuarios para, por ejemplo, identificar turistas, qué idioma hablan y qué teléfono usan. Un mapa que no existe pero que es fácil de imaginar es el que se deriva de la combinación de esas tres búsquedas: si no eres ciudadano, hablas otro idioma y llevas un teléfono barato, no eres un turista, eres un inmigrante.
Como siempre, lo más importante recordar que esta información es acumulativa y que llega en peligrosa combinación con otros datos, generados por nuestras tarjetas de crédito, nuestros dispositivos móviles, nuestros logins para ver el correo o comprar billetes de avión aquí o allí. Una compañía como Elastic.co analiza muchas fuentes distintas de metadatos desde muchos ángulos diferentes, dependiendo del cliente en cuestión. Twitter es sólo un gramo más en la barra libre de datos que ofrecemos al mundo. Ni siquiera la peor.