No habrá transparencia sin la información en formatos adecuados

El proyecto de Ley de Transparencia es un debate de actualidad. Se están elaborando y publicando diversos informes sobre los problemas del borrador de la ley, con críticas a sus limitaciones, y comparaciones con las de países de nuestro entorno. Aunque en general son análisis detallados, no dan la suficiente importancia a dos temas que considero fundamentales: facilitar el seguimiento de cómo se gasta el dinero, y que los datos estén en formatos adecuados para el tratamiento informático automático.

Uno de los objetivos de la transparencia de los actos de gobierno es el control ciudadano para minimizar la corrupción. El “dinero en manos equivocadas” es causa, medio y efecto de la corrupción, por lo que cualquier ley de transparencia debería tener como objetivo prioritario facilitar el seguimiento del dinero que gasta la administración en su funcionamiento rutinario -tal como se hace en data.gov.uk- y no sólo los datos agregados.

Aunque también está de moda hablar del “Big Data” (análisis de datos masivos), se habla muy poco de sus problemas. La gran cantidad de ruido, la dificultad de seleccionar las señales y variables adecuados, y de hallar las relaciones importantes entre las diferentes variables. Los datos generados por las administraciones públicas son masivos, el análisis y seguimiento manual es prácticamente imposible. No sólo por la cantidad de datos, también por cómo filtrar y obtener los datos adecuados (códigos de cuentas, montos, identificación de beneficiarios), y cómo relacionarlos entre sí. Sin resolver de forma adecuada ambos problemas, no tendremos una transparencia efectiva.

De la lectura del proyecto de ley se desprende que bastaría con que la administración publique la información de forma similar a cómo se publican los boletines oficiales de los diferentes organismos. En el informe crítico enlazado anteriormente ya se menciona este problema:

Dentro de los principios generales, se sugiere que se incluya que la información que se publica deba hacerse en formatos electrónicos reutilizables y explotables y que se sugiere se señale expresamente la conexión con la legislación en materia de reutilización de la información del sector público (Ley 37/2007).

Los Boletines Oficiales se publican en formato texto (PDF y/o HTML, como en el BOE estatal, o los autonómicos), son sólo cadenas de caracteres, puro ruido, sin posibilidades de obtener y filtrar datos. ¿Cómo obtener los gastos y sus conceptos a partir de un texto sin semántica que se pueda interpretar automáticamente? ¿Cómo relacionar entre sí los diferentes conceptos? ¿Cómo obtener la número de partida o cuenta presupuestaria? Esto hace que las publicaciones de los diferentes boletines queden en algo testimonial, un “periódico” de la administración, una “fe pública” de las decisiones administrativas, sin posibilidades de análisis informáticos automáticos, y logrando -paradójicamente- que la tecnología digital genere casi más problemas (el también debatido “derecho al olvido”) que ventajas reales.

Las complejidades y diferencias contables entre las diferentes administraciones aumentan la complejidad del problema. Por ejemplo, una cuenta presupuestaria estatal transfiere a una de una comunidad autónoma, que pasa a ser una cuenta diferente, con sus propios códigos. Además, un mismo beneficiario puede recibir dinero de cuentas diferentes, con identificaciones diferentes, a veces sin un nexo de unión obvio. Un ejemplo simple, a partir de los diferentes boletines oficiales, intentad calcular el total de ayudas que recibe una película: éstas pueden venir del Ministerio de Cultura, del ICO, de las comunidades autónomas... y pueden otorgarse a la productora principal, o a cualquier otra, incluso a actores individuales para asistir a un festival. Si ya es muy complicado conocer las ayudas que recibió un sola película, imaginad hacer un seguimiento de todos los negociados de los diferentes organismos.

Por ello una ley de transparencia debería exigir que se publiquen todos los gastos de la administración que superen un determinado monto, que estos datos estén en formatos adecuados para su tratamiento automático, con la granularidad necesaria (no bastan los totales o porcentuales), y que contengan la información que facilite el seguimiento de los destinatarios de pagos y ayudas de todas las administraciones.

De no ser así, el resultado de la ley con su texto actual serán más “boletines oficiales” intratables informáticamente. Es decir, una relación señal/ruido casi en cero, más invisibilidad que transparencia, aunque incluyan a la Casa Real o a los partidos políticos. Que no se nos olvide lo fundamental.