Simon Rogers: “El periodismo de datos es sólo buen periodismo que emplea las últimas herramientas”

El Data Blog de The Guardian es la biblia del periodismo de datos. Y Simon Rogers es su creador. Esta disciplina, que bebe de fuentes tan diversas como la estadística, la informática o el periodismo de investigación, se basa en la extracción, filtrado y visualización de grandes cantidades de información, o Big Data.

En mayo se celebró en Perugia (Italia) el International Journalism Festival, la fiesta del periodismo más grande de Europa. Durante la primera semana de mayo miles de periodistas tomaron esta pequeña ciudad del centro de Italia para asistir a centenares de conferencias, presentaciones y debates sobre el futuro del periodismo. La Open Knowledge Foundation y el European Journalism Centre organizaron varias sesiones de la School of Data, en la que Rogers participó impartiendo talleres sobre Twitter y periodismo de datos. También hubo espacio para la reflexión, y en una mesa redonda sobre las elecciones europeas Rogers aseguró que “los resultados electorales no son abiertos, son datos que los medios compran y publican en formatos cerrados”.

Este periodista británico dejó The Guardian para entrar en Twitter, donde se encarga de visualizar millones de tuits para contar historias a través de los datos. La cita es en el restaurante del lujoso Hotel Brufani, una de las emblemáticas localizaciones del IJF14.

Trabajaste para The Guardian, donde creaste el Data Blog, y el anÌƒo pasado decidiste unirte a Twitter. ¿A queÌ se debe este cambio tan grande?

Twitter ya es para muchos la manera en la que vemos el mundo. Si hay una noticia de uÌltima hora puedes entrar y averiguar queÌ es lo que pasando. Es un fenoÌmeno que teniÌa ganas de entender. QueriÌa echarle un ojo al Big Data y ver el tipo de historia que se podiÌa extraer. Y ademaÌs California es un lugar fantaÌstico, ocurren muchas cosas alliÌ.

Y dando este paso, de una redaccioÌn a una empresa tecnoloÌgica, ¿sigues haciendo periodismo?

Por supuesto. Si me preguntas queÌ es lo que hago te direÌ que soy un periodista que trabaja en Twitter. Ser reportero es algo que forma parte de mi propio ADN. Las redacciones son lugares muy especiÌficos, he estado maÌs de quince anÌƒos trabajando en una y ya lo he experimentado. A lo mejor vuelvo alguÌn diÌa, no lo seÌ. Por el momento tengo la oportunidad de probar algo diferente y trabajar en cosas interesantes con los datos de Twitter.

¿CoÌmo surgioÌ la idea del Data Blog? ¿Era un proyecto separado de tu trabajo diario en The Guardian?

Yo trabajaba como editor del equipo de graÌficos. GeneraÌbamos ideas, y al empezar a visualizar Big Data comenzamos a pensar en queÌ es lo que pasariÌa si publicaÌramos esos datos. AsiÌ empezoÌ el Data Blog, como una viÌa para publicar datos en bruto a los lectores.

¿QueÌ piensas del estado actual del periodismo de datos? ¿Se estaÌ convirtiendo en algo global?

El periodismo de datos es soÌlo buen periodismo que emplea las uÌltimas herramientas. Cuando empeceÌ a trabajar en The Guardian no habiÌa internet en la redaccioÌn y teniÌamos que ir a la biblioteca para buscar la informacioÌn. A eso no lo llamaÌbamos 'periodismo de internet', pero de alguna manera hemos bautizado asiÌ al periodismo de datos. Lo que espero es que no se convierta en un periodismo cerrado, el periodismo de datos necesita ser abierto y transparente. Si publicas una historia con datos tienes que publicarlos, exponerlos al mundo. AsiÌ implicas a la comunidad en la historia, hacieÌndola maÌs fuerte. Eso es muy importante.

Iniciativas como la The New York Times con The Upshot, o la de Nate Silver con FiveThirtyEight ayudan a aumentar el conocimiento de los datos que tiene el ciudadano medio, algo muy positivo. Es interesante que hayan aparecido diferentes tipos de periodismo de datos, justo como pasa con el periodismo tradicional, donde hay periodistas que escriben reportajes, noticias, y otros trabajan en secciones como arte o moda.

Parece que los medios que maÌs estaÌn apostando por el periodismo de datos son The New York Times y The Guardian.

The Guardian ha estado publicando datos desde 1870, pero el periodismo de datos ha estado aquiÌ desde los anÌƒos 60. The New York Times ha puesto el nivel por las nubes. Son gente increiÌble que hace un trabajo muy bonito, con clase y sofisticado. Por contra yo uso herramientas gratuitas que todo el mundo pueda usar. Lo que me importa es que sea replicable por cualquiera, faÌcil de copiar.

¿Por queÌ?

Cuando pienso acerca del periodismo de datos no creo que debas sentir “esto es muy complicado, jamaÌs podriÌa hacerlo”. Debe ser algo como “despueÌs de leer esta historia entiendo algo acerca de estas cifras que antes no comprendiÌa y podriÌa hacerlo yo tambieÌn”. De esta manera podriÌas descubrir algo que se me ha pasado por alto.

Si quieres ser un reportero, un periodista, o incluso si soÌlo te interesan los nuÌmeros, no deberiÌas sentirte intimidado por ellos. El nuÌmero de descargas de los datos del Data Blog era muy bajo comparado con el de visitas pero con que tan soÌlo una persona los descargase ya era suficiente para miÌ. De esta manera ya has logrado los datos maÌs accesibles. No me gusta que la gente se canse de las cosas porque piensen que no son abiertas. No debe ser acerca de lo bueno que eres, debe ser acerca coÌmo los usuarios usan tus datos.

¿CoÌmo es tu trabajo en Twitter?

Suelo trabajar con el equipo de analiÌtica, formado por data scientists. TambieÌn con la gente del equipo de graÌficos haciendo visualizaciones, y los periodistas del News Team. Es una colaboracioÌn entre diferentes habilidades. Algunos de los proyectos que hemos hecho, como el que desarrollamos por el uÌltimo Discurso del Estado de la UnioÌn, han sido de las mejores de mi carrera en teÌrminos teÌcnicos y en coÌmo hacer una historia maÌs efectiva. PeriodiÌsticamente es muy satisfactorio.

Empezamos a pensar en coÌmo visualizar el discurso de Obama, porque todos los graÌficos de Twitter son abstractos. ¡Hay tantos datos, tanta informacioÌn! Millones y millones de tuits, muchas cosas que te llegan a confundir. Al final intentamos encontrar la manera de ligar el desarrollo del discurso con la actividad de Twitter. Nos inspiramos en el interactivo del The New York Times, donde puedes hacer clic en el guion y ver en viÌdeo la parte del discurso que corresponde. Al principio no funcionoÌ muy bien porque la visualizacioÌn fallaba al contar la historia. Finalmente acabamos con algo donde puedes ver la actividad a traveÌs un graÌfico de reacciones. Eso siÌ que funcionoÌ.

Al hacerlo embebible lo publicaron en Buzzfeed, en el Washington Post, en Mashable, en muchos sitios diferentes. Esto es muy interesante como periodista. En la eÌpoca en la que era un estudiante intentabas entrar a un perioÌdico nacional o a uno local. Eso era todo. Pero de repente empeceÌ a trabajar en la web del The Guardian y me convertiÌ en un periodista online, y luego ficheÌ por una empresa de tecnologiÌa. Es muy extranÌƒo, pero gracias a todas las crisis que ha tenido el periodismo siempre estaÌ cambiando. Se revuelve, cambia, se desarrolla.

EstaÌs usando muchos mapas, muchos datos geograÌficos.

He estado experimentando con eso, probablemente demasiado. CartoDB es una herramienta fantaÌstica que te permite crear mapas muy bonitos faÌcilmente. Eran pruebas para averiguar queÌ es lo que funciona mejor. Al final el tipo de mapas que funcionan bien son en los que puedes ver plasmado el movimiento, la actividad. Los mapas globales soÌlo te dan un tamanÌƒo relativo, la explosioÌn de intereÌs en algo. MaÌs tarde puedes usar esos tuits para predecir si ocurriraÌ una noticia, ese es justo el trabajo del data mining.

Tienes disponibles millones de tuits para tus historias. ¿CoÌmo sabes cuaÌndo parar de filtrar?

Es muy complicado. Cuando estaÌs mirando los datos debes pensar, ¿queÌ es lo que busco?, ¿estoy intentando encontrar una aguja en un pajar? Debes preguntarte coÌmo habla la gente sobre lo que estaÌs intentando encontrar. Y muchas veces las cosas aparecen cuando visualizas los datos. Puedes apreciar si hay un intereÌs repentino en algo en concreto y el grado de ese intereÌs. Normalmente pienso en lo que seraÌ interesante para la historia y luego me sumerjo en los datos. Si miras los tuits de manera alejada son nuÌmeros abstractos, un milloÌn por aquiÌ, otro por alliÌ. Si en cambio te fijas en el porcentaje de tuits sobre un evento del total puedes saber mejor cuaÌl es su verdadero impacto.

En Twitter tambieÌn hay informacioÌn privada. ¿TeneÌis acceso a todos esos datos?

Twitter tiene acceso a los tuits privados pero no se pueden publicar. Supongo que hacemos una especie de contrato con los usuarios, porque nunca emplearemos sus datos para algo de lo que no les hayamos informado. SoÌlo usamos datos puÌblicos como retuits, seguidores o conversaciones puÌblicas. Si te fijas en otras redes sociales estaÌs dando tu vida, doÌnde vives, tus aficiones, tus relaciones... Y parte de esa informacioÌn se convierte en su propiedad.

Nosotros no queremos eso, no queremos esa informacioÌn, no es de nuestra propiedad. SoÌlo nos interesa coÌmo la gente usa Twitter para mejorar la plataforma, para hacer Twitter maÌs simple y sencillo. Como periodista nos interesa coÌmo usarlo de manera efectiva para mejorar tu trabajo, la noticia de uÌltima hora.

¿QueÌ es lo proÌximo que habeÌis planeado?

Hay muchas cosas. Tenemos la Copa del Mundo y grandes elecciones alrededor del mundo, en India, en los EEUU... Si sigues a Twitter Data iraÌs viendo lo que hacemos este anÌƒo.

Con todos estos acontecimientos, ¿cuaÌles son tus criterios para seleccionar uno u otro?

Es realmente una variacioÌn de responder a noticias de uÌltima hora y a eventos planeados, grandes momentos que sabemos que seraÌn importantes en Twitter y en el mundo. De estos uÌltimos intentaremos contar la mejor historia posible.

Simon Rogers: “El periodismo de datos es sólo buen periodismo que emplea las últimas herramientas”

Creador del Data Blog de The Guardian, es considerado uno de los pioneros en el periodismo de datos, una disciplina que mezcla la extracción, el filtrado, y la visualización de datos

En Twitter trabaja como Data Editor visualizando los tuits que generan acontecimientos globales como los Juegos Olímpicos o la muerte de Nelson Mandela