Simon Rogers: “El periodismo de datos es sólo buen periodismo que emplea las últimas herramientas”
El Data Blog de The Guardian es la biblia del periodismo de datos. Y Simon Rogers es su creador. Esta disciplina, que bebe de fuentes tan diversas como la estadística, la informática o el periodismo de investigación, se basa en la extracción, filtrado y visualización de grandes cantidades de información, o Big Data.
En mayo se celebró en Perugia (Italia) el International Journalism Festival, la fiesta del periodismo más grande de Europa. Durante la primera semana de mayo miles de periodistas tomaron esta pequeña ciudad del centro de Italia para asistir a centenares de conferencias, presentaciones y debates sobre el futuro del periodismo. La Open Knowledge Foundation y el European Journalism Centre organizaron varias sesiones de la School of Data, en la que Rogers participó impartiendo talleres sobre Twitter y periodismo de datos. También hubo espacio para la reflexión, y en una mesa redonda sobre las elecciones europeas Rogers aseguró que “los resultados electorales no son abiertos, son datos que los medios compran y publican en formatos cerrados”.
Este periodista británico dejó The Guardian para entrar en Twitter, donde se encarga de visualizar millones de tuits para contar historias a través de los datos. La cita es en el restaurante del lujoso Hotel Brufani, una de las emblemáticas localizaciones del IJF14.
Trabajaste para The Guardian, donde creaste el Data Blog, y el año pasado decidiste unirte a Twitter. ¿A qué se debe este cambio tan grande?
Twitter ya es para muchos la manera en la que vemos el mundo. Si hay una noticia de última hora puedes entrar y averiguar qué es lo que pasando. Es un fenómeno que tenía ganas de entender. Quería echarle un ojo al Big Data y ver el tipo de historia que se podía extraer. Y además California es un lugar fantástico, ocurren muchas cosas allí.
Y dando este paso, de una redacción a una empresa tecnológica, ¿sigues haciendo periodismo?
Por supuesto. Si me preguntas qué es lo que hago te diré que soy un periodista que trabaja en Twitter. Ser reportero es algo que forma parte de mi propio ADN. Las redacciones son lugares muy específicos, he estado más de quince años trabajando en una y ya lo he experimentado. A lo mejor vuelvo algún día, no lo sé. Por el momento tengo la oportunidad de probar algo diferente y trabajar en cosas interesantes con los datos de Twitter.
¿Cómo surgió la idea del Data Blog? ¿Era un proyecto separado de tu trabajo diario en The Guardian?
Yo trabajaba como editor del equipo de gráficos. Generábamos ideas, y al empezar a visualizar Big Data comenzamos a pensar en qué es lo que pasaría si publicáramos esos datos. Así empezó el Data Blog, como una vía para publicar datos en bruto a los lectores.
¿Qué piensas del estado actual del periodismo de datos? ¿Se está convirtiendo en algo global?
El periodismo de datos es sólo buen periodismo que emplea las últimas herramientas. Cuando empecé a trabajar en The Guardian no había internet en la redacción y teníamos que ir a la biblioteca para buscar la información. A eso no lo llamábamos 'periodismo de internet', pero de alguna manera hemos bautizado así al periodismo de datos. Lo que espero es que no se convierta en un periodismo cerrado, el periodismo de datos necesita ser abierto y transparente. Si publicas una historia con datos tienes que publicarlos, exponerlos al mundo. Así implicas a la comunidad en la historia, haciéndola más fuerte. Eso es muy importante.
Iniciativas como la The New York Times con The Upshot, o la de Nate Silver con FiveThirtyEight ayudan a aumentar el conocimiento de los datos que tiene el ciudadano medio, algo muy positivo. Es interesante que hayan aparecido diferentes tipos de periodismo de datos, justo como pasa con el periodismo tradicional, donde hay periodistas que escriben reportajes, noticias, y otros trabajan en secciones como arte o moda.
Parece que los medios que más están apostando por el periodismo de datos son The New York Times y The Guardian.
The Guardian ha estado publicando datos desde 1870, pero el periodismo de datos ha estado aquí desde los años 60. The New York Times ha puesto el nivel por las nubes. Son gente increíble que hace un trabajo muy bonito, con clase y sofisticado. Por contra yo uso herramientas gratuitas que todo el mundo pueda usar. Lo que me importa es que sea replicable por cualquiera, fácil de copiar.
¿Por qué?
Cuando pienso acerca del periodismo de datos no creo que debas sentir “esto es muy complicado, jamás podría hacerlo”. Debe ser algo como “después de leer esta historia entiendo algo acerca de estas cifras que antes no comprendía y podría hacerlo yo también”. De esta manera podrías descubrir algo que se me ha pasado por alto.
Si quieres ser un reportero, un periodista, o incluso si sólo te interesan los números, no deberías sentirte intimidado por ellos. El número de descargas de los datos del Data Blog era muy bajo comparado con el de visitas pero con que tan sólo una persona los descargase ya era suficiente para mí. De esta manera ya has logrado los datos más accesibles. No me gusta que la gente se canse de las cosas porque piensen que no son abiertas. No debe ser acerca de lo bueno que eres, debe ser acerca cómo los usuarios usan tus datos.
¿Cómo es tu trabajo en Twitter?
Suelo trabajar con el equipo de analítica, formado por data scientists. También con la gente del equipo de gráficos haciendo visualizaciones, y los periodistas del News Team. Es una colaboración entre diferentes habilidades. Algunos de los proyectos que hemos hecho, como el que desarrollamos por el último Discurso del Estado de la Unión, han sido de las mejores de mi carrera en términos técnicos y en cómo hacer una historia más efectiva. Periodísticamente es muy satisfactorio.
Empezamos a pensar en cómo visualizar el discurso de Obama, porque todos los gráficos de Twitter son abstractos. ¡Hay tantos datos, tanta información! Millones y millones de tuits, muchas cosas que te llegan a confundir. Al final intentamos encontrar la manera de ligar el desarrollo del discurso con la actividad de Twitter. Nos inspiramos en el interactivo del The New York Times, donde puedes hacer clic en el guion y ver en vídeo la parte del discurso que corresponde. Al principio no funcionó muy bien porque la visualización fallaba al contar la historia. Finalmente acabamos con algo donde puedes ver la actividad a través un gráfico de reacciones. Eso sí que funcionó.
Al hacerlo embebible lo publicaron en Buzzfeed, en el Washington Post, en Mashable, en muchos sitios diferentes. Esto es muy interesante como periodista. En la época en la que era un estudiante intentabas entrar a un periódico nacional o a uno local. Eso era todo. Pero de repente empecé a trabajar en la web del The Guardian y me convertí en un periodista online, y luego fiché por una empresa de tecnología. Es muy extraño, pero gracias a todas las crisis que ha tenido el periodismo siempre está cambiando. Se revuelve, cambia, se desarrolla.
Estás usando muchos mapas, muchos datos geográficos.
He estado experimentando con eso, probablemente demasiado. CartoDB es una herramienta fantástica que te permite crear mapas muy bonitos fácilmente. Eran pruebas para averiguar qué es lo que funciona mejor. Al final el tipo de mapas que funcionan bien son en los que puedes ver plasmado el movimiento, la actividad. Los mapas globales sólo te dan un tamaño relativo, la explosión de interés en algo. Más tarde puedes usar esos tuits para predecir si ocurrirá una noticia, ese es justo el trabajo del data mining.
Tienes disponibles millones de tuits para tus historias. ¿Cómo sabes cuándo parar de filtrar?
Es muy complicado. Cuando estás mirando los datos debes pensar, ¿qué es lo que busco?, ¿estoy intentando encontrar una aguja en un pajar? Debes preguntarte cómo habla la gente sobre lo que estás intentando encontrar. Y muchas veces las cosas aparecen cuando visualizas los datos. Puedes apreciar si hay un interés repentino en algo en concreto y el grado de ese interés. Normalmente pienso en lo que será interesante para la historia y luego me sumerjo en los datos. Si miras los tuits de manera alejada son números abstractos, un millón por aquí, otro por allí. Si en cambio te fijas en el porcentaje de tuits sobre un evento del total puedes saber mejor cuál es su verdadero impacto.
En Twitter también hay información privada. ¿Tenéis acceso a todos esos datos?
Twitter tiene acceso a los tuits privados pero no se pueden publicar. Supongo que hacemos una especie de contrato con los usuarios, porque nunca emplearemos sus datos para algo de lo que no les hayamos informado. Sólo usamos datos públicos como retuits, seguidores o conversaciones públicas. Si te fijas en otras redes sociales estás dando tu vida, dónde vives, tus aficiones, tus relaciones... Y parte de esa información se convierte en su propiedad.
Nosotros no queremos eso, no queremos esa información, no es de nuestra propiedad. Sólo nos interesa cómo la gente usa Twitter para mejorar la plataforma, para hacer Twitter más simple y sencillo. Como periodista nos interesa cómo usarlo de manera efectiva para mejorar tu trabajo, la noticia de última hora.
¿Qué es lo próximo que habéis planeado?
Hay muchas cosas. Tenemos la Copa del Mundo y grandes elecciones alrededor del mundo, en India, en los EEUU... Si sigues a Twitter Data irás viendo lo que hacemos este año.
Con todos estos acontecimientos, ¿cuáles son tus criterios para seleccionar uno u otro?
Es realmente una variación de responder a noticias de última hora y a eventos planeados, grandes momentos que sabemos que serán importantes en Twitter y en el mundo. De estos últimos intentaremos contar la mejor historia posible.