Internet y el futuro de la demoscopia
Nuestros comportamientos digitales van dejando un rastro, una huella digital, en forma de datos que son la principal fuente de ingresos de las grandes tecnológicas. En un entorno de apariencia gratuita, nuestra actividad es la minería de datos más valiosa que guían a los anunciantes (corporativos o políticos) y nosotros somos su audiencia cautiva. El tratamiento, control y seguridad de estos datos también se han convertido recientemente en una preocupación entre la opinión pública. El escándalo de Facebook y su papel en distintos procesos electorales ha sido el último recordatorio de hasta qué punto hemos perdido el control de nuestra privacidad y cómo esta puede ser objeto de comercialización sin nuestro consentimiento.
Pero nuestra actividad digital tiene otra derivada menos conocida. Los datos que generamos no son solo una fuente de negocio o un foco de conflicto entre tecnológicas, ciudadanos y reguladores, también pueden tener la clave para ayudarnos a comprender mejor fenómenos políticos, sociales y económicos. Maneras de ver, manera de pensar. Los datos nos permiten cartografiar conceptualmente mejor los problemas e identificar sus relaciones causales. Esto en política es decisivo. Contamos con cantidades ingentes de información que nos pueden aportar nuevos enfoques para tratar de poner luz sobre escenarios complejos como el resultado de unas elecciones, las movilizaciones no previstas de un colectivo concreto o las necesidades cambiantes de los consumidores.
Se trata de bases de datos que podemos obtener con inmediatez, en grandes cantidades y con formatos distintos y complementarios. Pero existe otro elemento que las hace aún más interesantes y las diferencias de la demoscopia clásica: en los entornos digitales no medimos opiniones, sino que medimos comportamientos. Búsquedas en Google, publicaciones y comunidades en redes, consumo de contenidos, etc. Se trata de acciones espontáneas, no condicionadas por un cuestionario o un entrevistador, que mezclan actitudes racionales (una apuesta en un mercado de predicciones) y emocionales (una publicación en redes sociales), que evolucionan en el tiempo y que, en definitiva, nos pueden dar una visión alternativa a la que nos ofrecen los métodos de investigación tradicionales. Además, a diferencia de la demoscopia tradicional, podemos seguir evaluando este comportamiento con un volumen de datos muy superior y casi en tiempo real, en secuencia y en línea temporal.
Un buen ejemplo de esta “nueva demoscopia” que está emergiendo lo encontramos en la obra Everybody Lies: Big Data, New Data, and What the Internet Reveals About Who We Really Are, de Seth Stephens-Davidowitz. El autor, excientífico de datos en Google y columnista habitual de The New York Times, lleva años investigando con datos del buscador temas tan dispares como el odio étnico en la sociedad estadounidense, el machismo, el posicionamiento ideológico y sus derivadas políticas en la sociedad estadounidense. La conclusión de Davidowitz es que nuestras búsquedas difieren considerablemente de nuestras opiniones expresadas en sondeos o en público. En esta misma línea, el investigador apunta que, al analizar los datos por territorios, se dio cuenta de que las actitudes de tipo racista o discriminatorio se dispararon en aquellos Estados en los que Trump obtuvo un mejor resultado. No se trata de una información concluyente pero sí que nos ayuda a comprender hasta qué punto este tipo de datos pueden enriquecer el análisis.
Otra fuente de datos son las redes sociales. Actualmente existe un debate, no exento de controversia, sobre la capacidad de predecir resultados electorales a partir de la información extraída en redes como Twitter. Las investigaciones desde el ámbito académico nos muestran que no existe consenso acerca de su fiabilidad, pero también indican que se está avanzando en nuestra capacidad de análisis. En concreto, se citan dos aspectos que pueden suponer un cambio relevante. En primer lugar, a medida que la herramienta va creciendo en usuarios y contenidos se vuelve más representativa del conjunto del electorado, lo que ayuda a disminuir el margen de error por problemas en la muestra. Y, en segundo lugar, la combinación de metodologías está mejorando la capacidad de acierto de los experimentos más recientes. Cada vez tenemos más capacidad para analizar qué dicen los usuarios (los contenidos) y cuántos lo dicen (el volumen de publicaciones).
Estos dos casos son un buen ejemplo de cómo esta nueva disciplina se va abriendo camino de la mano de las nuevas técnicas de análisis de Big Data. En este punto es importante mantener la perspectiva y no actuar con apriorismos acerca de la utilidad o no de estos datos. Las metodologías de investigación tradicionales se han desarrollado durante años hasta adquirir la credibilidad que tienen actualmente. Como apunta Stephens-Davidowitz “de momento no sabemos cuál es la metodología adecuada para ponderar los tweets y las búsquedas de Google, lo que sí sabemos, sin lugar a duda, es que hay información importante que sólo podremos sacar de estos datos”.
Estamos aprendiendo a analizar estos datos y, por tanto, descubriendo qué nos pueden ofrecer. Quizá esto sea lo más relevante: comprender que, en realidad, cuando buceamos en las búsquedas de Google lo que estamos observando son los intereses de los usuarios, que las publicaciones en redes sociales pueden ayudarnos a identificar los temas que marcan la agenda pública, que nuestro consumo de contenidos, por ejemplo en YouTube, describe la atención que prestamos a cada tema, o que nuestras apuestas en los mercados de predicción explican cuáles son nuestras creencias.
Nuestros comportamientos digitales nos describen como individuos, pero también como colectivo. Cada vez parece más evidente que la información que publicamos, consultamos, compartimos y consumimos es una de las mayores fuentes de conocimiento a la que hemos tenido acceso, por su volumen, pero sobre todo por cómo aporta nuevos matices y nuevos aprendizajes. Aunque, como hemos apuntado anteriormente, apenas estamos al principio de este camino. Queda todo por hacer y, sobre todo, queda descubrir hasta qué punto cambiar la materia prima con la que trabajamos —los nuevos datos digitales— puede provocar un cambio en la comprensión del entorno y en las decisiones que tomamos al respecto. Es un mundo nuevo que dibuja un horizonte de nuevas posibilidades.