“Qué recibo yo a cambio de que estas empresas utilicen mis datos sin siquiera contarme qué están haciendo con ellos”. Es una de las preguntas que más se repite la gente cuando comienza a entender qué son los datos masivos, el big data, pero no tiene ningún ejemplo de uso cotidiano al que agarrarse.
En tan solo dos meses, trabajando con una base de datos muy limitada, los participantes de un datathon celebrado en España han propuesto 144 aplicaciones distintas. Ideas concretas y realizables, plasmadas en programas que funcionan de forma real aunque no todas de forma perfecta, una demostración para poner de manifiesto la multitud de caminos que se pueden seguir con los macrodatos.
El evento, llamado Innova Challenge Big Data, ha girado completamente en torno al BBVA, promotor y también suministrador del contenido y de las herramientas. Grupos reducidos de desarrolladores de varios ámbitos como las startups, departamentos de grandes empresas o la universidad han accedido por primera vez a la API del banco y han contado con los datos agregados de más de 30 millones de transacciones realizadas con tarjeta de crédito en las ciudades de Madrid y Barcelona en un periodo de tiempo cerrado.
“Los participantes han tenido acceso a seis meses de datos de pago con tarjeta, agregados y anonimizados”, explica Marco Bressan, director de Open Platform de BBVA. “Los datos presentan cierta granularidad marcada por el límite de la privacidad”, como por ejemplo temporal, hasta el minuto de la transacción; espacial, por lugar donde se produjo o el código postal de origen; o social, diferenciadas por edad y género del propietario de la tarjeta. “Nunca podría llegar a decir qué persona está en qué lugar”, porque se requiere un mínimo de datos de un mismo tipo para poder formar parte del agregado.
La empresa no oculta el fin de su propuesta, “abrir el dato anónimo para que terceros piensen en aplicaciones que a nosotros desde el punto de vista estrictamente financiero no se nos ocurrirían”, Además de para la caza de talento, también ha servido para poner a prueba su infraestructura, cuenta Bressan, ha sido un experimento de trabajo en plataforma abierta.
Las apps premiadas
Las apps premiadas
Aplicaciones para uso personal, para consumidores, para empresas, para instituciones públicas o tan solo representaciones de datos, como el globo sonda que este mismo equipo puso en marcha durante el pasado Mobile World Congress en forma de visualización. El concurso ha premiado a tres trabajos por cada categoría que ponen de relieve las posibilidades.
Por ejemplo, una app llamada Qkly que analiza los pagos por tarjetas en un local comercial o una zona para que el usuario sepa cuándo se producen aglomeraciones y pueda planificar su visita sin esperar colas. O quizá otra semejante conectada a la red de transporte público para ayudar a decidir rutas.
En la categoría de consumo por ciudadano la conexión social ha estado muy presente, como en Mad4food, que busca perfiles semejantes al del usuario tomando los datos asociados a la tarjeta de crédito combinados con los de otras API para recomendar lugares en los que esa persona podría encajar.
El área del marketing ha sido una de las primeras en intentar aprovechar la utilidad de los datos masivos. Con una fuente de procedencia como la que ofrece BBVA varias propuestas han seguido el camino de la inteligencia comercial. Desde una aplicación llamada Chances que estudia parámetros como situación geográfica, tipo de cliente u horarios para determinar las probabilidades de éxito de un negocio a otra que trata de comprobar el éxito de campañas de marketing directo.
La tercera categoría es para estudiosos y curiosos, web y visualización. Hay quien ha conectado esta información con las críticas de Google Places, de modo que la opinión que pueda formarse el usuario es más completa: no sólo si de un lugar se opina bien, también si tiene mucha clientela. No están disponibles como tal, pero algunas sí existen sin conexion a los datos del concurso. La organización confirma que va a mantener el contacto con 30 equipos y espera poder repetirlo.
La cuestión de la privacidad
La cuestión de la privacidadMás allá del beneficio potencial como usuario de algunas de las aplicaciones, cada cliente es partícipe de los datos masivos con su propia información, una y otra vez, sea consciente o no del uso que se está haciendo de ella. Se llega al límite de la privacidad.
Como cualquier otra base de datos, la gestión del contenido se rige por la Ley de Protección de Datos de Carácter Personal. Cada país interpreta de distinta forma qué se debe proteger, con qué pueden comerciar las empresas y cuál es el organismo encargado de su vigilancia. Aquí en España lo es la Agencia Española de Protección de Datos.
Bressan defiende que siguiendo la legislación española “no hay ningún tipo de problema en exponer datos agregados” porque el big data no es información personal, son estadísticas capaces de describir patrones y comportamientos colectivos, e insiste en que “el banco es el principal interesado en la privacidad y en que no haya ningún tipo de problema”. A pesar de todo, la apertura de sus bases de datos se ha realizado por el momento de forma puntual y bajo la supervisión de los servicios jurídicos de la compañía. Como responsable de la plataforma abierta repite varias veces su deseo de que haya más apertura pero reconoce que es un proceso complejo.
La razón de peso para avanzar más despacio que en otros sectores económicos es que “hay una diferencia entre tener datos de usuarios, como Facebook, y datos de clientes. Si el cliente no ve ningún valor en este tipo de ejercicios por más que no sean datos individuales, es muy difícil para nosotros seguir adelante. Es necesario que estemos todos cómodos con esta situación.”
Sin embargo, no hay proceso de aceptación de la cesión estos gastos con tarjeta para su uso, el usuario es automáticamente parte de la base de datos con tan solo utilizarla. Tampoco hay un mecanismo de exclusión o baja.
El futuro de los datos masivos a gran escala
El futuro de los datos masivos a gran escalaDecía Viktor Schönberger, autor del libro “Big data, la revolución de los datos masivos” y profesor de regulación y gestión de Internet en la Universidad de Oxford que los datos masivos son el nuevo oro. Y la mina tiene dueño: quien acumula y almacena esos datos.
La culminación de este datathon está en sacar rendimiento a esa API. “Se trata de un esfuerzo que tiene un gasto y si el uso que se le da para los datos es comercial, lo lógico es que nosotros cobremos”, dice Bressan. Pero BBVA no está solo expectante a ver qué consiguen crear otros desarrolladores, también tiene equipos propios explotando esa mina en busca de su propia recompensa, ya sea comercial o de aprovechamiento interno.
La base de datos con la que han improvisado los participantes del concurso contiene más información comercial que cualquier estadística construida mediante encuestas al consumidor. “Solo en Madrid 500.000 pagos al día, algo te dice sobre lo que está haciendo la gente”, ironiza al ser cuestionado sobre la validez de la muestra, aunque reconoce que estas recopilaciones tienen otros puntos débiles que deben de ser ponderados, en su caso, el porcentaje de pagos en efectivo y el posible sesgo de la clientela.
Inteligencia comercial
Las empresas tienen la posibilidad de crear herramientas que ayuden a precisar la toma de decisiones. El big data se usa cada día, pero por el momento son las empresas nativas de internet las que han dado más pasos. Google, Facebook o Amazon hacen uso para encontrar respuestas a problemas concretos de su modelo de negocio: trabajar con cierto tipo de datos a tiempo real, indexar grandes volúmenes de datos de forma redundante para accesos rápidos, y agilizar ciertos procesos son tres de los ejemplos que pone el de BBVA.
“El desafío está en empresas que no son nativas digitales como nosotros”, opina Bressan refiriéndose al open banking. Añade que cadenas comerciales y de distribución como Walmart también están sacando partido a sus datos. Bressan no duda de que “si se hace respetando las restricciones legales, si se consigue que la gente entienda que el tema del dato abierto versus el dato cerrado que se utiliza no solo va en beneficio en una institución o una empresa, al final la gente se va a terminar inclinando por el dato abierto.”