Twitter patina como oráculo electoral

Twitter es más que una moda que fascina a periodistas o una herramienta que asusta a algunos políticos. En los últimos años, esta plataforma de comunicación social está recibiendo creciente atención por parte de distintas ramas de la ciencia para poner a prueba su pulso. En la era del Big Data, tal cantidad de información espontánea que millones de seres humanos comparten a cada instante en las redes sociales tiene que resultar útil para muchas cosas. Eso piensan numerosos investigadores, que se han lanzado a analizar tuits para cosas tan dispares como vaticinar éxitos en las taquillas de cine, prevenir la difusión de bulos antivacunas y pronosticar la evolución de la bolsa.

Y por supuesto, para el análisis electoral. Ya se ha probado la capacidad de las redes sociales para movilizar al electorado y desde hace un tiempo se está estudiando si también sirven para adelantar el resultado de comicios. El punto de partida es sencillo: los usuarios de Twitter terminan por trasladar a la red sus sentimientos, intereses y aficiones por lo que debería servir de sondeo natural. Podría ser un termómetro electoral perfecto ya que es espontáneo y ofrece una muestra amplísima de participantes.

Con esta premisa, ya se han pronosticado los ganadores de numerosas elecciones por todo el mundo: desde las federales alemanas de 2009, hasta las presidenciales de Ecuador, Venezuela y Paraguay. También se ha visto esta correlación en las recientes legislativas de Argentina. Incluso en España, donde Twitter adelantó la victoria de Mariano Rajoy, según un trabajo de la Politécnica de Madrid. El último estudio que ha relacionado mensajes en esta red social con el comportamiento electoral se presentó la semana pasada, en la Reunión Anual de la Asociación Americana de Sociología. El título del estudio deja claro cuál es la tesis de sus autores: Más tuits, más votos: los medios sociales como un indicador cuantitativo del comportamiento político.

Joseph DiGrazia y otros investigadores de la Universidad de Indiana analizaron millones de tuits para encontrar una correlación entre las victorias de 795 candidatos al Congreso y la presencia de su nombre en Twitter. Básicamente, el candidato que más menciones recibe en forma de tuits termina ganando el escaño. Da igual el sentido de las menciones: “que hablen de uno, aunque sea mal”, valdría como resumen de la tesis de estos investigadores. Según sus datos, lograron adelantar el ganador en más del 90% de los escaños en liza. ¿Quiere esto decir que Twitter sirve para vaticinar resultados electorales? Puede que estemos ante un ejemplo contemporáneo del mito de la caverna de Platón: sombras de una verdad distinta.

“Hay algo”, expresa Daniel Gayo-Avello, profesor de la Universidad de Oviedo, “pero todavía es muy poco como para lanzar las campanas al vuelo. Es cierto que parece darse una correlación positiva, pero no vale con decir que es fuerte. Hay que medir, cuantificar esa correlación: ¿el doble de tuits implica el doble de votos, cuántos más?”, pregunta Gayo-Avello, que se ha convertido en un Pepito Grillo frente a quienes, cada poco, dan por muertas a las empresas demoscópicas tras la irrupción de Twitter. “No se puede adivinar el resultado, al menos no de manera sistemática, no cuando no sabes qué elección vas a fallar ni por qué margen y sólo puedes ofrecer explicaciones post-facto”, zanja.

Múltiples flaquezas del torrente de información

Una de las principales pegas de todos estos estudios que adivinan resultados electorales es que los aciertan a toro pasado. De los numerosos estudios que han acertado presidentes o legisladores solamente uno, centrado en las elecciones presidenciales de EEUU de 2012, envió sus resultados antes de que se supiera el resultado. El resto suelen buscar correlaciones entre tuits y votos una vez se conoce el resultado.

DiGrazia explica a Materia que su principal vocación es únicamente la de “demostrar que con mediciones relativamente simples, construidas a partir de datos de los medios sociales, se puede establecer una correlación fiable con el mundo real”. Es lo que dicen en el estudio: no pretenden hacer pronósticos, sino mostrar que la gente se comporta en las redes tal cual es y que por tanto Twitter sería el reflejo de sus sentimientos hacia la política o el ocio. “Además”, añade DiGrazia, “los medios sociales pueden ayudar a dar una idea sobre algunos temas específicos que son difíciles de captar a través de votación tradicional”, en referencia a sectores demográficos poco representados en las encuestas.

Sin embargo, el debate académico se ha calentado después de que otro de los firmantes del estudio sobre el Congreso de EEUU, Fabio Rojas, escribiera un artículo en el Washington Post defendiendo sin ambajes que Twitter servirá para predecir sufragios. Preguntado por esa discrepancia con su colega DiGrazia, Rojas nos asegura que Twitter sí tiene ese futuro: “Sí, creo que estos estudios tienen un gran potencial. No somos el único grupo de investigación que ha encontrado resultados similares, incluso en sistemas con candidatos múltiples o multipartidistas”. “En el futuro veremos si dan mejores resultados que las encuestas tradicionales”, concluye.

Sesgo de autoselección y manipulación

Twitter tiene todavía muchos obstáculos que sortear hasta convertirse en el oráculo que defiende Rojas. Se suele señalar una gran debilidad: la del sesgo de autoselección. Hay asuntos y circunstancias —que podrían ser momentos concretos de las campañas— en los que la participación en Twitter aumenta por una parte del electorado y se reduce en la contraria. A juzgar por Twitter, por ejemplo, la población norteamericana sería más partidaria del matrimonio homosexual de lo que realmente es. No es sólo que la población tuitera no sea representativa: es que hay temas que invitan a publicar su opinión a usuarios de una determinada ideología y a callar a los de la contraria.

No obstante, el mayor problema es la de la exactitud de los pronósticos. La mayoría logran adivinar el presidente elegido, pero no los porcentajes de voto o los escaños. La brocha gorda funciona, reconoce Gayo-Avello, pero no el pincel fino, que en muchos casos puede ser incluso más importante. “El margen de error sigue siendo muy superior al de las encuestas preelectorales, con porcentajes muy elevados para partidos pequeños”, explica el investigador de la Universidad de Oviedo.

Es lo que ocurrió con el estudio publicado el año pasado por el equipo de Rosa Benito, catedrática de Física, en la revista Chaos. En las legislativas españolas de 2011, el porcentaje de tuits con menciones al PP y al PSOE es razonablemente similar al resultado electoral. Pero la distorsión que se produjo en el caso de UPyD —casi el triple de tuits que de votos— es el gran talón de Aquiles para quienes quieran servirse de Twitter para pronosticar escaños. El electorado de UPyD es extraordinariamente proactivo en redes sociales, del mismo modo que la extrema derecha en Francia es más discreta que el resto, por lo que es muy complicado corregir las distorsiones que surgen en estos estudios.

Acaba de publicarse otro paper que analiza esta supuesta correlación, esta vez centrado en las elecciones legislativas alemanas de 2009. Los resultados no pueden ser más negativos para quienes pretenden que Twitter sea el oráculo perfecto. Durante la campaña, el partido más mencionado en esta red —con diferencia— fue el Partido Pirata, que sin embargo apenas alcanzó el 2% de los sufragios y ni siquiera consiguió representación en el Bundestag: mucha presencia en la red, debilidad en las urnas. Además, los socialistas casi hubieran empatado con la CDU y Die Linke hubiera sido la cuarta fuerza del país (ver gráfico).

Distorsiones del Big Data

Este estudio señala otras flaquezas: las menciones son muy inestables en el tiempo, en los mensajes predomina la carga negativa (su valor aún está en entredicho) y las alusiones a los candidatos dependen en exceso de sus apariciones televisivas. “Este análisis muestra que, al menos para las elecciones federales de Alemania de 2009, los datos de Twitter no son un fuerte indicador de los destinos electorales de los partidos o candidatos mencionados en Twitter”, sentencia Andreas Jungherr de la Universidad de Bamberg.

En casos de bipartidismo es más fácil optar por candidatos, pero muchos sistemas políticos son más complejos y dependen de las minorías. Además, lo que ocurre con UPyD en España o con el Partido Pirata en Alemania es un reflejo de lo que podría ocurrir si se consolidara el uso de Twitter como fuente de pronósticos electorales. Es evidente que los partidos intentarían inflar sus menciones en la red para mejorar sus predicciones. Un ejemplo: durante las últimas elecciones presidenciales de EEUU, se cazó al candidato republicano, Mitt Romney, comprando seguidores en Twitter para mejorar su imagen en la red frente a Obama.

“El mayor problema es que se trata de una herramienta fácilemente adulterable. El incentivo para tratar de manipular que se le ofrece a los partidos sería demasiado poderoso, ¿cómo diferenciamos un tuit legítimo de uno creado con un bot para mejorar el pronóstico de un partido? Entraríamos en el terreno de las profecías autocumplidas: si parece que va a ganar un partido, el electorado rival podría desmovilizarse”, vaticina Gayo-Avello.

Herramienta de futuro

Este investigador ha realizado un metaanálisis de los estudios que ligan tuits y votos y reconoce que ha moderado su discurso: no cree imposible vaticinar escaños pero reclama un modelo y predicciones realistas antes de las elecciones y menos “habríamos podido”. Pone como ejemplo el trabajo que está realizando el italiano Andrea Ceron, de la Universidad de Milán: un modelo híbrido que se sirve de Twitter y sondeos demoscópicos que ayuden a leer mejor el resultado que ofrecen los tuits y ajusten el sistema predictivo. Los datos de Twitter son masivos, baratos y se pueden recoger en tiempo real. Pero conviene ajustarlos con información recogida a pie de calle, sugiere Gayo-Avello.

Twitter sí es una herramienta que ayuda a leer muchos otros reflejos de la realidad con razonable exactitud. “El escenario político es el más problemático. Se han logrado importantes resultados, con predicciones más acertadas, en taquillas de cine, en ventas de videojuegos o en epidemias”, explica el investigador de la Universidad de Oviedo, pero en la política la capacidad predictiva flaquea por la complejidad de los factores en liza.

La información que proporciona el Big Data (ingentes cantidades de información procesada con herramientas informáticas) es extraordinariamente valiosa, pero hay que mantener un pie en el suelo para evitar que algunos componentes distorsionen la lectura. Después de muchos años, Google se equivocó en su predicción de la epidemia de la gripe en EEUU, después de muchos años clavando su difusión. Google se nutría de las consultas que su buscador recibía para pronosticar donde golpeaba la gripe con más fuerza. Sin embargo, este invierno la herramienta recibió una importante atención por parte de los medios que ayudados por la viralidad de las redes terminaron por falsear el resultado.

Google anunció que revisará su algoritmo. Y los mineros de datos en las redes sociales seguirán ajustando sus herramientas para sacar oro de los tuits espontáneos. Hasta encontrar un equilibrio entre la realidad, su reflejo y otros termómetros sociales. Como resume Gayo-Avello: “Está fuera de lugar pensar que van a desaparecer las empresas demoscópicas. Y es absurdo ignorar toda la información que proporciona lo que se dice en las redes sociales”.

Una información de MateriaMateria

Twitter patina como oráculo electoral

El análisis de los mensajes compartidos en la red social muestra cierta capacidad para pronosticar el resultado de los comicios y muchos dan por enterradas a las empresas demoscópicas. Sin embargo, Twitter todavía muestra demasiadas flaquezas como reflejo de la realidad electoral.

Múltiples flaquezas del torrente de información

Sesgo de autoselección y manipulación

Distorsiones del Big Data

Herramienta de futuro