Cómo abrir un portal de datos públicos (y que no cierre en un año)

Nació en marzo de 2011 y no duró ni dos años: en noviembre de 2012 había desaparecido. Costó 382.000 euros. Del portal de datos abiertos de Córdoba sólo queda una petición en Tuderechoasaber.com que pregunta a sus responsables por qué cerró y que no tiene respuesta. “Llamé y me explicaron que el director que lo abrió ya no estaba y el que lo cerró tampoco. En un año hubo tres directores y se perdieron casi 400.000 euros”, cuenta Victoria Anderica, de Access-Info.

El caso le llevó a preguntar a otras 19 administraciones cuánto había costado su portal de datos abiertos: recibió siete respuestas satisfactorias, seis imprecisas y mostró que los proyectos más caros cuestan, como mucho, algo más de 100.000 euros. En el de Zaragoza, uno de los mejores casos nacionales según los expertos, se invirtieron 81.000 euros para mejorarlo. El del País Vasco costó 113.000 incluyendo difusión y mejoras, no sólo la web.

La de Córdoba es, junto a la de Asturias, una de las dos iniciativas de datos abiertos muertas de las 31 que han nacido en nuestro país. “Es positivo que haya portales de datos abiertos por muchas razones: sociales, económicas... Poca gente duda sobre eso. Pero sí es cierto que en España, como ha pasado con otras cosas, cuando se trata de construir somos despilfarradores. Y hay que tener en cuenta que cuando las cosas se hacen sólo por moda se abandonan”, continúa. “El portal no sirve de nada si inviertes cien mil euros y no lo mantienes. Si nos ponemos a abrir portales como setas pasan cosas como la de Córdoba. Abrir un portal requiere una responsabilidad de continuidad”. Civio también ha criticado que se abran portales open data “como aeropuertos sin aviones”.

El fin de estos portales es ser un catálogo de información (no sólo de gastos e ingresos políticos, sino de cualquier servicio público, como el tiempo, transporte o farmacias de guardia) que dejan los departamentos públicos en formato reutilizable (no pdfs imposibles); el sitio al que sepas que puedes ir a buscar sets de datos o a pedir los que quieres pero aún no están. Desde que en 2009 Reino Unido y Estados Unidos lanzaron sus portales nacionales, la tendencia ha calado en muchos países, España incluida. “Y no siempre hace falta un portal: antes está que publiques bien la información”, considera David Cabo, fundador de Civio.

Abrir datos es algo más complejo que montar una web: primero habrá que tenerlos y ordenarlos y eso requiere cambios en los procesos de los departamentos públicos. ¿Cómo lograr que el entramado administrativo lo haga bien a nivel local, regional y nacional? El método es joven y no está del todo resuelto en ningún sitio, pero hemos hablado con varios expertos para que nos expliquen lo que, hasta la fecha, han aprendido.

Que una persona se haga cargo del proyecto

 “Los departamentos crecen por cambios políticos, cambian de nombre… Nunca hubo concepto de ‘chief data officer’ o jefe de datos. Está empezando a ser algo más claro, igual que el marco de referencia de estándares, formatos y calidad”, explica Antonio Acuña, director del portal nacional de datos de Reino Unido, uno de los países que más tiempo lleva trabajando el tema. Una vez ahí, recomienda Cabo, que ha trabajado con portales de datos abiertos en España, “empieza viendo qué tienes, pregunta a los posibles consumidores de datos qué quieren y déjales sugerir”.

Comprobar qué datos hay y cuáles podrían registrarse

¿Qué datos se manejan en una agencia pública? ¿Se registran? ¿En qué formato? ¿Y qué se hace con ellos, adónde van? “Es un problema genérico en todos los gobiernos y todavía estamos trabajando en ello: no hay inventario de datos en casi ningún departamento”, cuenta Acuña.

“Algunos, como los que manejan los conceptos de inundaciones que utilizan para hacer llamadas de emergencia, sí entienden muy bien los datos que usan”, continúa. Por poner ejemplos en España: el Ministerio de Industria recoge diariamente el precio de la gasolina en formato reutilizable, así que hay apps que te dicen dónde ir a repostar. También muchas agencias de transporte tienen sus datos liberados. En la EMT de Madrid, ya en 2009, los estructuraron para hacer su propia app. “Desarrollamos una arquitectura de servicios con información en tiempo real y de planificación (líneas, paradas, itinerarios, horarios, incidencias y referencia geográfica)”, explica Enrique Diego, subdirector de Tecnología y Sistemas de Información. “Estaba concebida para uso público. Dijimos: ¿por qué no facilitársela a terceros?”

Sin embargo, guardar los datos que se producen no es lo normal. “Imagínate un Ayuntamiento o una Universidad. Tienen que rendir cuentas y enviar datos a las instancias superiores de la Administración. Pero se tiran a la papelera de reciclaje”, añade Pablo Martín, del colectivo OpenKratio. Vamos, que capturarse se capturan datos, pero no entran en un estado de saber que están ahí y tienen un valor. Más si se abren. De hecho, otro de los argumentos de los defensores del open data es que genera eficiencia dentro de la propia Administración, que al final mantiene ordenados sus datos y sabe cómo acceder a ellos.

Publicar, publicar y publicar

Suponemos que es útil saber dónde venden gasolina barata o cuándo viene el autobús. Pero ¿de qué sirve una tabla con la localización de los 18 quioscos de flores que hay en Valencia? “Hay una visión de ‘voy a poner este set de datos con estrellas, redes de datos enlazados semánticos…' y luego lo publicas y no interesa a nadie. Pero expertos como Alberto Ortiz de Zárate - pionero en políticas de datos abiertos en España - defienden que empieces a publicar lo que tengas para ver la demanda”, cuenta Cabo. En Reino Unido también siguen esta filosofía: el 'no interesa a nadie’ o ‘no tiene calidad’ puede ser la excusa perfecta para no publicar. “En data.gov.uk podemos revisar si tiene columnas y elementos correctos (calidad de formato) y estamos trabajando para que eso sea automático. Pero no podemos determinar la calidad (del contenido): tú podrías poner AA BB CC y que no sirva de nada”.

Trabajan en dos líneas. “Una es publicar, publicar y publicar. La otra es centrarse en aquellos datos que consideramos, y que considera el público, que tienen valor. Porque hay un peligro enorme. La excusa que te dan las agencias es: la calidad es malísima, espérate a que lo arreglemos y ya lo publicamos. No, publícalo como está, di que la calidad es mala pero no dejes de publicarlo. No queremos romper ese comportamiento”.

Llevarlo a nivel nacional

Tanto data.gov como data.gov.uk o datos.gob.es son el nivel nacional, el catálogo que, se supone, agrupa todos los sets de todas las agencias del país. “La descentralización es inevitable, pero hay formas de hacer las cosas mejor”, considera Anderica. “En España cada administración es responsable de sus datos: eso hace que vaya a haber una cantidad ingente de portales. No es lo más eficiente”. En datos.gob.es la parte técnica se hace en red.es y la estrategia en la Secretaría de Estado de Telecomunicaciones. Desde allí y por email, Cristina Morales, subdirectora general de contenidos, explica que para integrarlos “los conjuntos de datos del catálogo que se federan se envían al portal de forma automatizada y mediante un fichero de datos en formato semántico DCAT/RDF. Así, se registran en el catálogo nacional sin necesidad de hacer la doble labor de catalogarlos”. Hay 2.230 sets.

En Reino Unido, donde el equipo tiene un jefe de proyecto y cinco desarrolladores y cada administración también es responsable de enviar sus datos, han llegado a los 4.000 sets aunque saben que aún no está completo: en este post explican la infraestructura de información nacional, o cómo van a identificar qué falta por publicar. Ya trabajan para estandarizar el lenguaje de 'dentro' de los sets. “Muchos de los datos del gobierno central provienen de los gobiernos locales. Hay que encontrar el punto de: los dos lo hacemos así y nos entendemos. Lo que en Asturias es ‘montaña’ en Galicia puede ser otra cosa, así que la idea es usar un marco”.

Hablar con los consumidores y mejorar el producto

Hay un paso más: atender a las peticiones de nuevos sets que requiera la gente. En datos.gob.es, como en la mayoría de portales regionales, hay un botón de sugerencias para solicitar datos. En Reino Unido, “tenemos un proceso de peticiones y un grupo externo, el open data user group, que analiza las peticiones y crea los ‘business case’ de vuelta para convencer a un departamento de que hay que publicar algo”. Por otro lado, la web es una beta permanente: no es un producto cerrado y siempre está mejorando. “No quiero cambiar el principio fundamental: es un catálogo de datos”, asegura Acuña. “Podemos experimentar, pero si eso va a afectar a tu capacidad para encontrar un dato, entonces no”.

Llegar a los ciudadanos

“Al ciudadano no le importa que haya datos abiertos. Al ciudadano le importan los servicios que recibe basados en ellos. Y a ti y a mí, suponiendo que no estuviéramos al tanto de esto, ni nos va ni nos viene. ¿Datos qué? Pero si ahora te digo: en esta aplicación ves las peticiones que se hicieron de extensión de viviendas, y tienes un vecino construyendo algo que no crees que sea legal, vas y lo miras. Importa que haya un servicio”. Por eso, más allá de convencer a las administraciones y catalogar los sets, hay un trabajo de fomentar su uso. Si no, ¿de qué sirven?

“Nosotros hemos hecho visualizaciones de presupuestos en Euskadi y Aragón. En Aragón lanzaron a la vez el portal con la visualización para decir: esto es un ejemplo de lo que puedes hacer”, añade Cabo. Otra idea son los hackatones, eventos para desarrollar aplicaciones a base de esos datos (aquí hay información los que se organizan en España). “Hacer un hackday no significa que seas transparente. Son maravillosos, sobre todo para la gente joven y codificadores, pero es la élite. El asunto es expandirlo. ¿Cómo mantenemos esa conexión? Asegurándonos de que existen esos servicios”.

Tener un portal de transparencia es el nuevo tener un portal de datos abiertos, que es el nuevo tener una web, que es el nuevo tener un aeropuerto…

“Después de la ola de portales de open data ha llegado la ola de portales de transparencia”, asegura Cabo. El Gobierno valenciano presentó hace pocas semanas el suyo, recibido con críticas por estar vacío. “En España los datos abiertos tuvieron un boom anterior al boom de la transparencia”, coincide Anderica. “Luego se empezó a confundir transparencia con open data. Algo de verdad tiene, pero no toda. Es importante aclarar que el open data no deja de ser una obligación que deben asumir las instituciones públicas con la evolución de las tecnologías: no nos basta que seas transparente y nos digas cuánto gastas, sino que a eso le vamos a añadir otro formato que nos permita utilizar esa información”.

Con todo, concluye Acuña, “son dos narrativas. Con los datos abiertos está la narrativa de transparencia. Van mano a mano porque no puedes decir: soy transparente y te digo todo lo que he hecho pero tienes que pagar para ver el archivo. Puedes usar la narrativa de la transparencia como vehículo para referirte a la narrativa de los datos abiertos. El error sería hablar a los ciudadanos como a desarrolladores. Les importa la transparencia y les importa saber que, si les fuera necesario, tienen el derecho y la habilidad de obtener esos datos: es recordarle al ciudadano que esos son los pilares que aseguran que el gobierno puede rendirle cuentas y que él puede demandarlas. Esto cambia el mecanismo. Ahora el gobierno rinde explicaciones porque el ciudadano tiene los datos que necesita”.