“El 99% de los datos está en manos privadas y eso para el progreso de la humanidad no supone nada”
Habla delante de una audiencia que viste en un ratio 9:10 traje y corbata y que, sorpresa, no usa Twitter. Todos han venido a un congreso de 'visual analytics' – o cómo analizar la información mostrándola de forma muy visual - para ver qué pueden hacer sus compañías (aseguradoras, banca, inmobiliarias y hasta El Corte Inglés) con todos esos datos que tú y yo nos dejamos cada día por el camino cuando buscamos, compramos u operamos en internet. El presentador del evento abre comentando: “¡Me encanta el 'big data'!”. Después, explica al público cómo puede aprovecharse contando el ejemplo del periódico Tribune, que analiza masivamente las redes sociales para saber de qué se habla, qué preocupa a la gente, y así ofrecer mejores temas.
“¡Tribune mide el sentimiento de un país con datos!”. Ohh. Pero, ¿de verdad usa todo el país las redes sociales? Ahh.
La teoría del “ohh”, o la fascinación, y el “ahh”, la reflexión, es una pequeña parte de la conferencia que da, después de la presentación, Jer Thorp. Este canadiense de 38 años, original de Vancouver y desde hace tres años en Nueva York, se hizo llamar a sí mismo 'artista de datos' en The New York Times, donde trabajó hasta el pasado mes de enero, cuando fundó The Office For Creative Research. ¿Qué hace exactamente un 'data artist' como Thorp? Como cuenta en las charlas que da, humanizarlos: darles carácter, hacerlos más bonitos y visuales para que se comprendan mejor.
Esas ingentes cantidades de datos que tenemos hoy en día gracias a todos nuestros movimientos en internet o en el móvil (el 'big data') son algo así como 'el nuevo petróleo'. Thorp los utiliza para diseñar piezas artísticas - ¡ohh! - pero que revelen información - ¡ahh! -; las empresas, para ver cómo vender más y mejor a sus clientes. Es más o menos lo que ha venido a aprender la audiencia del traje y corbata y la razón por la que Thorp, que ilustra muy bien el tema (¡ohh!), es el encargado de la primera ponencia del congreso. Cuando termina, le preguntamos por todo esto y alguna cosa más. ¡Ahh!
¿Cómo entiende la gente tu trabajo? ¿Como arte? ¿Diseño? ¿Ciencia?
Creo que lo interpreta de maneras diferentes y me parece bien. Uso la palabra 'artista' porque es la más fácil, con la que la gente no se enfada. Si dijera que soy diseñador, no gustaría a los diseñadores; si dijera que soy científico, los científicos se enfadarían, así que si digo que soy artista está bien. El trabajo que hago en el estudio puede verse como investigación, arte conceptual y algo entre medias.
¿Cómo es el proceso cuando creas una obra? ¿Empiezas con el tema, con los datos que tienes o con el diseño?
Con los datos, pero cómo conseguimos esos datos es diferente en cada proyecto. A veces alguien nos los da; otras, nos dicen que les gustaría que investigáramos sobre un tema y encontráramos los datos que encajen. El trabajo no empieza realmente hasta que no tenemos los datos correctos; hay muchas preguntas antes. ¿Cuáles son? ¿Cómo lo usamos? ¿Encajan juntos? Normalmente, identifico a la gente que puede tener datos interesantes o les pregunto cuáles nos pueden valer.
A los científicos, por ejemplo, les encanta ver su trabajo visualizado porque no tienen tiempo para hacerlo y es fácil trabajar con ellos. Otras veces hacemos temas muy amplios. Hicimos, por ejemplo, un proyecto sobre comida. De todo lo que hay sobre comida, ¿qué datos son interesantes? Queremos los que permitan a la gente explorar. Me interesa el carácter de los datos. En los proyectos vamos hacia la particularidad, a entender esos detalles mejor.
¿Trabajas con 'storytellers' para que se entienda mejor?
Me gusta pensar que todos somos un poco 'storytellers'. A veces hay historias muy lineales: quieres contar algo, coges un gráfico, otro gráfico, los pones juntos y ya tienes historia. Pero me gusta pensar que lo que hacemos es postmoderno. No contar la historia de forma lineal, sino de forma diferente, permitiendo que la gente extraiga lo que quiera.
El proyecto que más reto ha supuesto...
Probablemente, el de Cascade, con gente de The New York Times. Nadie había hecho eso antes. El tema era también muy nuevo. Twitter es relativamente joven y empezamos a descubrir cómo se construían las estructuras de las conversaciones. Fue un reto en el buen sentido, porque estábamos en un territorio en el que no había referencias.
NYT Labs - Cascade from Lucas Black-Dendle on Vimeo.
Antes le has preguntado al público cuánta gente tenía Twitter y casi nadie tenía. Hay un trabajo sobre la exclusión que puede haber en el 'big data'. ¿Qué opinas?exclusión que puede haber en el 'big data'
Procuro ser muy cuidadoso cuando describo los proyectos, porque cuando visualizas no visualizas la cosa, sino una medición de la cosa. En el caso de visualizar conversaciones en Twitter, nada que saques te va a decir algo sobre la gente. Te va a decir algo sobre la gente que usa Twitter, y sobre la gente que usa Twitter con cuentas públicas, y sobre la gente que usa Twitter en inglés con cuentas públicas. Tu muestra es más pequeña, igual que lo que puedes sacar de ella. Y eso está totalmente bien siempre que lo entiendas, pero no todo el mundo lo entiende.
Cuando escribo artículos con datos tengo la sensación de que podría decir lo que quisiera. podría decir lo que quisiera
Sí. Es muy importante y la gente no piensa en ello, no es especialmente culta cuando se trata de datos. Así que es bastante fácil venderle a alguien 'la medida de la cosa'. Por ejemplo, había una 'app' en Boston para informar sobre los baches de las carreteras: la gente ponía su 'smartphone' en el coche y cuando había un bache la 'app' lo 'trackeaba' automáticamente. Eso te va a decir por dónde conduce en Boston la gente rica con 'stmarphone', no todos los baches... Es un problema y no creo que la gente sea tan consciente como debería.
Al final de lo que estamos hablando es de muestreo. Si eres inteligente muestreando y entiendes los problemas y las técnicas de muestreo, harás un buen trabajo sobre algo, pero no estoy seguro de que mucha gente sea sofisticada con ello. Por ejemplo, pocas empresas hacen analítica de social media, normalmente pagan a una compañía para que se lo haga. Y esa compañía no va a querer hablar sobre lo que estamos hablando ahora, porque no les ayuda a vender su producto. No querrán venderse como “¡hey!, estos datos que te damos no son legítimos”. Lo harán parecer más de lo que es y si las empresas lo usan como parte de su inteligencia... El problema es que, de momento, nadie piensa en ello.
¿Necesitarán las empresas entonces un 'data scientist' (una persona que extraiga el significado de los datos)?
Quizá me meto en problemas diciendo esto, pero el problema es que no hay ciencia en muchos 'data scientists'. La ciencia es hacer preguntas y en eso los científicos son muy, muy críticos. Y yo no veo esa parte crítica en muchos 'data scientists'. Es algo muy nuevo, no existía hace dos años y ahora mismo se están contratando más 'data scientists' en el mundo occidental que cualquier otro puesto. Odio usar la palabra, pero conozco a importantes 'data scientists'. Y una de las críticas que hacen es que hay gente entrando que puede tener la habilidad de usar Hadoop (un sistema para procesar volúmenes muy grandes de datos) o alguna máquina, pero no saben hacer preguntas. Y eso es lo realmente importante. Dos personas hacen un algoritmo y una industria entera crece alrededor. No quiero ser muy crítico, pero creo que hay una estructura piramidal en la innovación de los 'data scientists'. Una o dos tecnologías y todo el mundo implementándolas. No hay suficiente gente escribiendo nuevas tecnologías. Pero no quiero ser muy crítico, es genial que tengamos gente haciendo estas cosas.
Has hablado de la relación personal con los datos. ¿Qué datos interesantes podríamos sacar de un iPhone como el mío?
Los de localización. Tu iPhone tiene tu localización todo el rato. Y la mayoría de nuestros datos de localización se guardan porque tienes WiFi y la mayoría de las señales de WiFi en el mundo están 'viewcoded' por Apple o Google. Ellas saben que estoy aquí cuando entro aquí.
No me disgusta tener, por ejemplo, un mapa que sitúe las fotos que he sacado.
A mí también me gusta. Suelo usar este ejemplo: vas al médico y te haces un análisis de sangre. Tenemos diferentes niveles de confort con cómo compartir nuestros datos. A la mayoría nos parecería bien que un médico viera ese análisis. A algunos les parecería bien que un centro de investigación lo viera, a otros no. Probablemente a nadie le parecería bien que todo el mundo lo viera. Y lo más importante: no nos parecería nada bien que una compañía de seguros lo viera y cambiara nuestra cuota en función de ello.
Ese es el tipo de cosas que están pasando ahora mismo. Las aseguradoras están viendo tus 'tweets' para saber tus 'hobbies' y lo usan para calcular tu cuota: si tienes un barco te ofrecerán un seguro de salud, porque la gente con barco gana más. Me parecería bien si todo el mundo supiera esto, pero la mayoría no lo sabe. Lo bueno es que según la gente empiece a estar más concienciada de esto habrá una nueva tendencia en las empresas, que será el ser éticas con los datos. Preferiremos una compañía que sea honesta que a una que los esté vendiendo. Es la esperanza que tengo.
También hay gente que expone sus propios datos para ver si alguien hace algo útil con ellos.
Es un debate, empezó en Estados Unidos y ahora el tema de la vigilancia lo ha traído otra vez. Hablamos de vigilancia gubernamental, pero creo que terminaremos hablando de vigilancia corporativa y según siga el debate las cosas irán mejor. Hay alguna empresa que ya comparte contigo qué datos tiene de ti para que le puedas decir, por ejemplo, que hablaras de motos con tu amigo por Facebook no significa que tengas una moto si quieren ofrecerte un seguro. Hablamos mucho de los datos como algo de la humanidad, como “wow, la gente está creando muchos datos...”. Pero el 99% está en manos privadas. Y eso para el progreso de la humanidad no supone nada. Me gusta pensar que algo cambiará. No soy anticorporativo en absoluto, pero creo que los mejores negocios tendrán que estar basados en confianza.
Empezaste la charla diciendo que España te parece un sitio en el que puede calar esta idea de relación personal con los datos. ¿Por qué?
Pensé en ello esta mañana, en las diferencias culturales entre los sitios en los que he estado hablando (Alemania y Holanda). Es gracioso, ayer estuve en Holanda y todo empezó a tiempo, aquí vamos 30 minutos tarde, el cocktail es a las dos... La cultura es una gran parte de lo que hace España a España, ¿no? Eso es lo que dice todo el mundo. Y para mí los datos y la cultura están muy entrelazados. Y quizá la gente que tiende más a pensar en su vida diaria como ligada a la cultura, también tenderá a pensar en los datos como parte de su vida y cultura.
Cuando en mis charlas hablo de la relación personal con los datos, en según qué sitios responden mejor que en otros. En Alemania no responden tan bien. Tiene sentido. Pasé el fin de semana en Alemania, me preguntaron por qué Alemania es la que lidera las cuestiones de privacidad en Europa, y es que tiene experiencia. En América nunca ha pasado nada similar (quizá esté pasando ahora), de que el Gobierno de repente dé la vuelta a sus argumentos. En Europa hay experiencia y la gente es más consciente.
En Estados Unidos lo oigo mucho. “Yo no hago nada malo, no tengo nada que ocultar”. Les miro y digo: ¿BROMEAS? ¿No conoces la historia? Ser homosexual no era malo, ser judío no era malo, pero los gobiernos pueden decidir que es malo. El Gobierno de Kuwait ha anunciado que va a poner un programa en los aeropuertos para detectar homosexuales y que no entren en el país. Una forma de detectarlos es a través de las redes sociales. Y si un Gobierno decide de repente que algo deja de ser bueno y esos datos están públicos, entonces tenemos un gran problema.