La portada de mañana
Acceder
Israel no da respiro a la población de Gaza mientras se dilatan las negociaciones
Los salarios más altos aportarán una “cuota de solidaridad” para pensiones
Opinión - Por el WhatsApp muere el pez. Por Isaac Rosa

La memoria de la Red cumple veinte años: así conserva el pasado Internet Archive

Hace dos décadas, en Estados Unidos también se vivía una intensa campaña electoral con un Clinton como candidato a presidente. La World Wide Web asistía por primera vez a unas elecciones estadounidenses, así que se propuso narrarlas. El Instituto Tecnológico de Massachusetts (el famoso MIT) creó unas primarias virtuales para que la gente opinara sobre los aspirantes a la Casa Blanca, que contaba por entonces con una versión web que hoy consideraríamos sumamente cutre.

Almacenar cuidadosamente esas páginas para el porvenir fue una de las primeras labores de Internet Archive, una organización sin ánimo de lucro que se ha convertido en la memoria de internet: preserva ya la historia de 510.000 millones de páginas en su máquina del tiempo particular. “Tenían una apariencia muy divertida, fue realmente bonito”, rememora Brewster Kahle, fundador de esta ONG asentada en San Francisco.

El próximo 26 de octubre, Internet Archive celebrará su vigésimo cumpleaños en una fiesta abierta para el público donde se escanearán libros o se experimentará con la realidad virtual en una máquina ‘arcade’. Eso sí, la cruzada de Kahle no ha terminado ni mucho menos.

“Queremos la biblioteca de Alejandría versión 2 disponible para todo el mundo [...] Todos los libros, la música, las páginas web, el ‘software’.... Todo lo que ha creado el ser humano disponible para todo el mundo, desde cualquier sitio”, asegura a HojaDeRouter.com el padre de esta criatura que ha engordado hasta los los 25 petabytes (25 millones de gigabytes).

El “bibliotecario digital” que aprendió de Marvin Minsky

En 1995, cuando menos del 1 % de la población mundial tenía acceso a internet, Kahle vio la Web. Treinta millones de páginas se encontraban almacenadas en dos servidores, del tamaño de dos máquinas expendedoras, propiedad del primitivo motor de búsqueda Altavista. Kahle preguntó si podía llevarse una copia. Le dijeron que no, así que decidió buscarse la vida.

Este altruista bibliotecario ya había aportado su granito de arena a la Red de redes. Estudió informática en el MIT, donde un profesor le sirvió de inspiración para el resto de su carrera: el mismísimo Marvin Minsky, recientemente fallecido. Este pionero de la inteligencia artificial transmitió a Kahle una enseñanza que nunca olvidó: “Piensa a lo grande”. “La idea de tener un objetivo que no acabarás es buena idea”, reflexiona Kahle.

En 1989 trabajaba para una empresa que construía superordenadores cuando ideó WAIS, un primitivo protocolo para publicar en internet precursor de las tres uves dobles y que ya incluía un control de versiones.

Su obsesión por crear una biblioteca de Alejandría comenzó por aquel entonces. En 1996, llamó Alexa a la empresa que fundó en homenaje al mayor templo del saber de la antigüedad. A los tres años, vendió a Amazon esta compañía, que mide el tráfico de la web, por la friolera de 250 millones de dólares (unos 322 millones de euros de la actualidad teniendo en cuenta la inflación).

Desde entonces, Alexa dona todas las webs que almacena a Internet Archive. De hecho, la memoria de la Red usa, entre otras, las arañas de esta compañía para rastrearla. Así que el informático acabó convirtiéndose en un “bibliotecario digital”, como él mismo se define. “Soy un idealista y un seguidor de las utopías y también soy un tecnólogo”.

Eso sí, crear esa máquina del tiempo donde arañas y humanos (tú incluido) almacenaran de vez en cuando el legado de las webs para que cualquiera pudiera consultarlo fácilmente —aquí puedes ver retazos del de HojaDeRouter.com— fue idea de un ingeniero que trabajaba en Internet Archive. A Kahle le entusiasmó. Estrenaron la Wayback Machine en 2001. “Pensábamos que la gente iba a utilizarlo solo para encontrar algunas cosas, pero descubrimos que lo utilizaban todo el tiempo”, señala Kahle con orgullo.

Pese a que las arañas de Wayback Machine no indexan todo — la ONG reconoce que hay páginas que no archiva, entre otros motivos porque su propietario puede impedirlo desde el archivo robots.txt— ni tampoco rastrean todas con la misma frecuencia, la herramienta es todo un éxito. Es el archivo más amplio de internet.

600.000 personas retroceden en el tiempo cada día gracias a ella, descubriendo contenidos antiguos o extintos, cuyos autores a veces han querido borrar de la historia a propósito. Hace unos meses, se enorgullecían precisamente de tener guardada la página que Melania Trump eliminó. La web no olvida. “Hay gente trabajando en proyectos interesantes cada año, así que el crecimiento de la Wayback Machine es muy, muy rápido”, señala Kahle, que nos anuncia notables mejoras en la herramienta para celebrar el cumpleaños de su obra maestra.

Creando la segunda biblioteca de Alejandría…

Poco a poco, Kahle fue archivando muchos otros materiales con ayuda de los usuarios. Ya preserva 11 millones de textos (de libros a periódicos escaneados o microfilms), 2,8 millones de vídeos (de películas de Chaplin a antiguos anuncios de televisión) , 3,1 millones archivos de audio (10.000 de los conciertos de Grateful Dead) y 144.000 programas para los que añoren el MS-DOS.

Con los años, Internet Archive se ha convertido también en un lugar de culto para los ‘gamers’. Desde su web, podemos transportarnos a décadas pasadas para simular que controlamos el ‘joystick’ de la Atari 2600, evitamos al Donkey Kong de 8 bits Atari 2600Donkey Kongo construimos ciudades con el Age of empires. “Para algunos es solo nostalgia, una forma de revisitar su pasado, pero para otros es una forma de mostrar a otra gente cuáles son los trabajos creativos de la humanidad, y cada vez más y más están orientados a los ordenadores”.

Obviamente, coleccionar los frutos de la mente humana lleva su esfuerzo. En Internet Archive trabajan actualmente 140 personas. La mitad son archivistas, administradores y programadores. La otra parte trabaja digitalizando libros en centros repartidos por ocho países. A ellos se suman los 1.000 bibliotecarios que asesoran a Internet Archive para preservar las colecciones en sus estantes virtuales.

Precisamente las bibliotecas se han convertido en la mayor fuente de ingresos de esta organización que vive de las donaciones. La propia Biblioteca Nacional Española (BNE) les contrató para realizar el rastreo masivo del dominio .es, y la compañía californiana les envió unas cuantas cajas con el resultado a finales de 2014. Eso sí, los contenidos todavía no son de acceso público y ahora la BNE hace el trabajo utilizando su propio sistema.

Almacenar cajas es otra de las obsesiones de Kahle. Hace poco más de un lustro que, además de digitalizar libros, empezó a preservar una copia física de cada uno, tomando como modelo la Bóveda Global de Semillas de SavalbardBóveda Global de Semillas de Savalbard, en el Círculo Polar Ártico, para guardar “una acreditada y segura versión de las semillas que estamos haciendo crecer”. Cumplió su palabra transformando contenedores de carga en las viviendas de los volúmenes a una temperatura óptima, además de preservar los soportes originales de música o vídeo que suben a la Red. “Compramos un almacén e hicimos un archivo físico. Lo llenamos, así que compramos otro”, señala Kahle entre risas.

Pero la sede terrenal de este templo ‘online’ no está en ningún almacén, sino en un lugar a la altura de su valiosa misión: la antigua Cuarta Iglesia de Cristo CientíficoCuarta Iglesia de Cristo Científico, que hace años servía como punto de encuentro para los científicos cristianos. En 2009, Kahle decidió comprar este edificio de inspiración griega. “¡Se parece a nuestro logo!”, argumenta.

En lugar de esculturas de santos, en este templo, los fieles —decenas de estatuillas representan a los trabajadores de la organización— parecen rendir culto a los servidores que, con sus luces parpadeantes, avisan de que alguien está subiendo o bajando contenidos de Internet Archive. Kahle cree que visitar esta construcción, abierta al público, es importante para “poner cara al archivo” y “sentirlo”. “Mucha gente se rasca las manos y dice ‘bien, ¿dónde están vuestros libros?’ Bueno… nuestros libros están en su mayoría ‘online’”, señala Kahle. “Esto es muy útil para transformar lo viejo en lo nuevo”.

… que no quede reducida a cenizas

“Los primitivos manuscritos de la biblioteca de Alejandría fueron quemados [...] Un grupo de emprendedores e ingenieros hemos determinado que esto no le ocurra al primitivo internet”. Internet Archive presentaba en estos términos su gran misión en 1997. Lamentablemente, esta organización sabe lo que es ver las obras reducidas a cenizas. Uno de sus 30 centros de digitalización sufrió un devastador incendio hace unos años, aunque en poco tiempo recaudaron más de un millón de dólares para reconstruirlo.

Para evitar que su gran obra quede reducida a cenizas, Kahle nos cuenta que preservan una copia parcial en Ámsterdam. Sin embargo, no es suficiente. “Queremos hacer múltiples copias en múltiples lugares. No solo de nuestros materiales, sino de otros materiales también. Nos gustaría hacer un sistema de bibliotecas internacional que cree copias a gran escala que vayan a parar a otros lugares”.

Tampoco toda su colección está abierta al público. Los posibles conflictos a cuenta de los derechos de autor hacen que no todo el material que digitalizan se encuentre disponible ‘online’. Internet Archive no es una institución pública, por lo que hasta el archivista web de la Biblioteca Nacional de Francia considera “extremadamente atrevida” su labor.

La propia organización explica que eliminan los contenidos que vulneran el ‘copyright’ a petición de los interesados. Este mismo verano tuvieron que retirar las 145 revistas de Nintendo PowerNintendo Power, publicadas desde 1988, que habían subido a Internet Archive. Según la compañía nipona, su difusión debilitaba su capacidad para proteger y preservar esas colecciones.

A lo largo de los años, el guardián de este archivo ha superado otros obstáculos para defender la privacidad de sus usuarios. “Las bibliotecas protegen a los lectores, es un lugar seguro para leer”, defiende Kahle. En 2007, se enfrentó por ello con el mismísimo FBI, que le mandó una carta pidiendo información sobre uno de los usuarios registrados. Con ayuda de la Electronic Frontier Foundation y la American Civil Liberties Union, consiguió que la agencia federal se retractase. “Luchamos contra ellos y vencimos”, recuerda.

El auge de gigantes como Google o Facebook y el crecimiento de sus tentáculos es otra de las mayores preocupaciones de Kahle. “Es difícil tratar con estas plataformas en muchos sentidos. Son entidades corporativas que tienen sus propias reglas, son diferentes a la internet abierta que existía hace veinte años [...] Es una concentración de poder que creo que no hemos visto desde el Imperio Romano

Cómo continuar preservando internet en los próximos años teniendo en cuenta que no pueden sobrepasar las murallas de las redes sociales (Twitter sí anunció hace seis años un acuerdo con la Biblioteca del Congreso para preservar su memoria, pero ni siquiera se ha hecho pública) es uno de sus quebraderos de cabeza.

“Creo que el capitalismo y el dinero son gasolina que a veces se quema y a veces explota y no son las mejores formas de construir una idea a largo plazo”, reivindica. No niega que su fortuna le ha permitido llegar hasta aquí, aunque asegura que los beneficios le llegaron como “una sorpresa” porque, en los albores de la Red, “era casi imposible no ganar dinero”.

De un modo u otro, su altruista labor para proporcionar “el acceso universal al conocimiento” ha sido reconocida por el Salón de la Fama de Internetacceso universal al conocimientoSalón de la Fama de Internet, donde ocupa un lugar junto a figuras tan destacadas como Tim Berners-Lee o Vint Cerf. Ambos acudieron a su particular templo neoclásico este verano para celebrar la primera Decentralized Web Summit.

Junto a otros activistas, archivistas e investigadores, estos pioneros defendieron la necesidad de poner remedio tecnológico a la centralización de la web causada por empresas y gobiernos. “Conocimiento, libertad de expresión, confianza, privacidad y diversión” son los valores que, según defendió Kahle, deberían estar en el propio código de la Web.

Próximo reto: reunir los ‘e-books’ de las bibliotecas

Mientras trabaja con los padres de internet para crear una nueva web descentralizada, Kahle se ha marcado una meta más concreta para los próximos años. “En 2020 no queremos estar hablando de construir una biblioteca, queremos haber construido una biblioteca”. Dentro de cuatro años, este filántropo pretende que todo el mundo tenga acceso a todos los libros y recursos multimedia para ser un “ciudadano educado”.

Internet Archive abrió hace ya una década Open Library, un servicio que permite coger prestados cinco libros cada dos semanas. Mucho más ambiciosa es la iniciativa de Google Books, a la que Kahle critica por no permitir descargar desde su web los libros que son de dominio público. Ahora, pretende digitalizar hasta cuatro millones de libros modernos y promover que las bibliotecas estadounidenses, además de tener su clásica versión en papel, presten la digital a sus usuarios desde su propio sistema. Coordinándose con ellas, espera que el trabajo de digitalización no se duplique para cumplir con su objetivo.

Hacer accesibles las publicaciones científicas, donde “todo gira en torno al control”, es otra de sus batallas. No en vano, seguimos sin poder leer de forma gratuita algunos artículos científicos que hicieron historia, y ya hay quien ha creado hasta un Pirate Bay de las investigaciones. La Unión Europea ha apoyado el acceso gratuito, de aquí a 2020, a publicaciones científicas financiadas total o parcialmente con fondos públicos, un gesto alabado por Kahle, que espera que Estados Unidos tome ejemplo.

Como buen evangelista de la preservación, este pionero de internet hace una petición en su charla con HojaDeRouter.com: que extendamos su palabra. “Ahora tenemos la financiación para digitalizar todo lo que se dona a Internet Archive, así que si la gente tiene libros, música… nos gustaría ir y coleccionarlo y preservarlo para siempre”.

Este año, esta peculiar ONG también está guardando para el mañana los rifirrafes de la campaña electoral estadounidense: ha diseccionado con todo lujo de detalles los debates presidenciales y ha puesto los datos a disposición de los periodistas. “Creo que todo el mundo se sorprende de cuánto se comparte en internet [....] La gente quiere que lo que saben esté disponible para todo el mundo”, señala Kahle. Él, además de sorprenderse, continúa su batalla para preservar todos esos conocimientos. Ya lleva veinte años en la brecha. Y que cumpla muchos más.

--------

Las imágenes de este artículo son propiedad de Internet Archive, Beatrice Murch (7) y Eric Fischer (8)