Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.

Los cinco incunables de la visualización de datos

La Mona Lisa de la Visualización de datos: "Carta figurativa de las sucesivas pérdidas de hombres de la armada francesa en la campaña de Rusia de Napoleón en 1812" de Charles Minard (1869)

Marta Peirano

La marcha napoleónica de Charles Minard (1869)

La marcha napoleónica de Charles Minard (1869)

En junio de 1812, la Grande Armée de Napoleón cruzó el río Niemen en dirección a Moscú. No era una visita de cortesía. El Ejército más grande y mejor preparado del mundo invadía Rusia mientras las tropas del zar Alejandro I retrocedían dejando un sendero de humo y destrucción, su famosa táctica de tierra quemada. Cuando los franceses llegaron a Moscú, los generales rusos se habían marchado pero no sin antes prenderle fuego. El 19 de octubre, después de seis semanas esperando una capitulación que no llegaba en una ciudad defenestrada donde no quedaba ni comida para los soldados, ni pasto para los caballos ni refugio contra el invierno, Napoleón emprendió la vuelta a casa. Allí se encontraron al comandante Mijaíl Kutúzov, que les esperaba tranquilamente en el río Bérézina.

De los 422.000 hombres que empezaron la campaña, sólo 100.000 llegaron a Moscú. De los que dieron la vuelta, sólo 10.000 llegaron vivos a Francia. La famosa “Carta figurativa de las sucesivas pérdidas de hombres del Ejército francés en la campaña de Rusia de Napoleón en 1812” del venerable ingeniero francés Charles Joseph Minard (tenía ya 80 años) retrata con precisión y sencillez la penosa historia de esta campaña con una línea dorada que se desangra y cinco dolorosas variables: la fecha, su dirección y localización geográfica, el descenso de las temperaturas, la dirección del Ejército y la pérdida de vidas humanas. Los especialistas la Gioconda de la visualización de datos.

Minard marca los descensos de temperatura y las batallas importantes, notas a pie de página que resultan especialmente dolorosas en la lenta fuga del ejército que da la vuelta -ya en negro como la sangre seca- y que se va diezmando dramáticamente, víctima del hambre, las enfermedades, el general invierno y el comandante Kutúzov.

El mapa del cólera de John Snow (1855)

El mapa del cólera de John Snow (1855)

El cólera es una enfermedad explosiva y fulminante: empieza con dolorosos espasmos y sigue con un cuadro tan violento de diarrea y vómitos que la sangre se coagula en las venas de pura deshidratación, dejando cadáveres de un característico tono de piel azulado. Aunque los primeros casos documentados en Europa son de 1831, el cólera vivió su era dorada con la industrialización de las primeras ciudades, con parada estelar en el insalubre Londres victoriano, donde mató a 14.137 personas sólo en 1848 y a otras 10.738 en otro estallido en 1853.

Las grandes instituciones científicas estaban convencidas de que la infección estaba causada por la inhalación de aire contaminado procedente de aguas estancadas o residuales. Su argumento principal era que la epidemia azotaba especialmente las zonas más bajas de la geografía urbana, áreas donde se concentraban los “jugos” diarios de la ciudad y donde vivían los sectores más pobres de la población.

Entre los disidentes estaba el epidemiólogo John Snow, cuya hipótesis era que la enfermedad estaba causada por un germen y que se propagaba, no por aire, sino por agua. Cuando un brote especialmente violento acabó con la vida de 578 personas en una semana, Snow empezó un mapa donde cada muerte en cada casa quedaba marcada con un punto negro y los 13 puntos de suministro de agua, con un círculo rojo.

Edward Tufte cuenta en su clásico The Visual Display of Quantative Information que “[John] Snow se dió cuenta de que las incidencias de cólera ocurrían casi exclusivamente entre aquellos que vivían cerca del suministro de agua de Broad Street”. Más adelante se supo que el suministro de Broad Street había sido contaminado con las heces de un bebé enfermo. “Hizo que cambiaran el acceso contaminado -continúa Tufte- acabando con una epidemia que se había cobrado más de 500 vidas”. Lo que es verdad hasta cierto punto.

Como cuenta Alberto Cairo -profesor de infografía y multimedia en la Universidad de Miami- Snow no fue el primero en usar mapas epidemiológicos, ni siquiera del cólera; ese sería el mapa de Leeds del Dr. Robert Baker en el primer brote de 1833. Más importante aún, su impacto no fue tan grande como ha sugerido Tufte o como lo pinta Steven Johnson en The Ghost Map, su entretenida y mitificante historia novelada del mapa.

La genialidad de Snow no fue añadir sino quitar elementos del mapa; mientras otros ahogaban la visualización con demasiadas referencias, su decisión de limitar los datos a tres hizo visible lo que antes no lo era: que el origen de todos los males era una fuente específica. Lo cierto es que el establishment médico-sanitario no aceptó su teoría hasta bien entrados los sesenta, cuando Snow llevaba más de una década criando malvas.

Las flores de Florence Nightingale (1858)

Las flores de Florence Nightingale (1858)

La madre de la enfermería moderna no fue la primera en usar tartas estadísticas para demostrar una teoría; ese sería William Playfair en 1801. Pero sí podría haber sido la primera en usarlos para cambiar la política sanitaria de un pais entero y la primera mujer miembro de la Sociedad Estadística de Londres. Como Minard, Nightingale usó motivos gráficos para narrar la pérdida de un Ejército, en este caso el que el imperio británico mandó a la guerra de Crimea.

El 21 de octubre de 1854, Nightingale partió hacia Crimea con un equipo de 38 enfermeras voluntarias. Los informes previos a su viaje anticipaban un escenario dantesco pero, una vez allí, Florence descubrió que incluso en lo peor de la guerra -noviembre del 54- una gran parte de los soldados no morían por las heridas recibidas en el campo de batalla sino por las condiciones de higiene que soportaban en el barracón. En su famoso informe Notes on matters affecting the health, efficiency and hospital administration of the British army (Notas sobre la salud, eficiencia y administración de la armada británica), dividió las pérdidas en tres clases: en rojo, muerte por heridas; en azul, “enfermedades zimóticas prevenibles o mitigables” (enfermedades infeccionas como el cólera y la disentería); en negro, todas las demás causas.

Cada porción de la tarta es relativo al número de incidencias; cuantas más muertes, más grande el pétalo correspondiente. Las flores de Nightingale salvaron más vidas inglesas que todas las madres del Reino Unido rezando juntas el rosario porque, aunque no contaban nada nuevo, lo hacían de una manera tan dramática e inmediata que hasta la reina Victoria entendió sus implicaciones: lo que ocurría en el frente era extrapolable a cada hospital inglés. poniendo en marcha la reforma sanitaria.

El precio del trigo de William Playfair (1821)

El precio del trigo de William Playfair (1821)

El más temprano de la lista, el economista y playboy escocés William Playfair es considerado por muchos como el padre del gráfico estadístico: sus libro The Commercial and Political Atlas, que envió a Luis XVI poco antes de que el monarca perdiera la cabeza (1787), ya tenía gráficos de barras. Con el Statistical Breviary (1801), Playfair inauguró todas las convenciones del género: gráficos de barras, de fiebre y la sempiterna tarta.

Hay quien le llama cantamañanas y es verdad que su carrera indica una cierta propensión al desparrame y el desastre financiero, pero Playfair era hijo de uno de los momentos más burbujeantes de la historia de Europa: hermano del ilustre matemático John Playfair, colega de Adam Smith, David Hume y del grandísimo ingeniero James Watt -origen de la palabra “vatio”- con el que trabajó en varios proyectos realizando exquisitos grabados.

La economía fue su gran amor, especialmente la de contraste: sus grabados más notables muestran la recaudación de impuestos en diferentes países de Europa (mostrando que la Gran Bretaña se embolsaba de más) y el flujo de bienes comerciales entre las naciones, tomándole la temperatura al mercado de importación y exportación en el continente. El gráfico que hemos seleccionado cruza “el salario semanal de un buen mecánico” con “el precio de un cuarto de trigo” bajo distintos monarcas, un cálculo que no sólo sigue siendo relevante sino que resulta más escandaloso en la España democrática de 2014 que en la Inglaterra de la reforma.

Los árboles de Ramon Llull (1303)

Si España tuvo un Leonardo, tiene que ser el filósofo alquimista Ramón Llull, un malloquín que vivía a caballo entre la iluminación cristiana y la tecnología árabe, con fascinantes resultados. Sus diagramas mecánicos del conocimiento sirvieron de inspiración a Leibnitz para el desarrollo de su lógica simbólica o, como deberíamos empezar a llamarlo, el Antiguo Testamento de la Computación. Sobre esta entrada podemos ver dos de sus catorce árboles de la ciencia, donde Llull usa por primera vez la estructura orgánica de un árbol para representar el orígen y desarrollo de las grandes áreas del conocimiento.

Si la analogía parece vieja es porque lo es -concretamente, 1303- pero su influencia ha sido tan determinante que no es sólo un lugar común sino que está grabada en el ADN de nuestro lenguaje abstracto, incluyendo conceptos tan básicos y tan de calle como “la raiz del problema” o “la asignatura troncal”. En la ilustración, las raíces representan los grandes principios básicos; el tronco es la estructura; las ramas son los géneros, las horas son las especies y los frutos somos nosotros, la partícula última indivisible del gran árbol del saber.

El diagrama de Llull ha sido imitado hasta la ausencia, derivando en estructuras tan minimalistas como el árbol en paréntesis. La buena noticia es que estos cinco incunables están ahora expuestos en una sala del tercer piso del Centro de Cultura Contemporánea de Barcelona, como parte de la estupenda exposición Big Bang Data, abierta hasta el próximo mes de octubre, con una introducción estelar de Alberto Cairo que se puede ver gratis en el ciberespacio.

Etiquetas
stats