De todas las capacidades que conforman los sistemas Big Data, la que más me interesa es la del procesamiento de datos en tiempo real y cómo estos son expuestos para la generación de soluciones que aporten valor. En pocas palabras, cómo después de conseguir sacar el oro del río sin aniquilar el ecosistema, producimos joyas preciosas.

Recomendaría encarecidamente visionar el documental “Particle Fever” en el que, a través de 6 eminencias científicas, se narra la historia del lanzamiento del LHC, proyecto que cuenta entre sus objetivos recrear las condiciones que existieron microsegundos después del Big Bang. No se trata sólo del imponente complejo tecnológico, se trata del procesamiento de una ingente cantidad de datos (15 Petabytes/año) que almacenan en su Data Center y que es enviada posteriormente para su análisis distribuido.

En el CERN se alcanzan los límites del Cloud Computing en un difícil equilibrio entre las necesidades de gestión de datos, los problemas de congestión en las comunicaciones y la utilización de estándares, todo dentro de un marco limitado por presupuestos finitos. Es una realidad que lo han conseguido y que continúan perfeccionándolo exprimiendo soluciones Open Source para el tratamiento de datos, como pueden ser Hadoop y MapReduce.

Bajando a temas más mundanos, no deja de sorprenderme la feroz “Batalla de los Planetas” que se está librando entre Facebook y Google. Parece que los límites presupuestarios no les afectan y que, tras poner en práctica su modelo Connect à Collect à Convert en medio mundo, están dispuestos a ir a por el resto. Mark Zuckenberg se ha aliado con la NASA para la fabricación de satélites y drones que lleven Internet a cualquier parte del mundo, mientras que Sergey Brin ya trabaja con el mismo objetivo en el proyecto Loon, utilizando globos estratosféricos para la creación de una red inalámbrica mundial. Más madera para el Big Data.

Nos encontramos definitivamente inmersos en una espiral creciente de conexión, recopilación y tratamiento masivo de datos en tiempo real, que sin duda requieren de más y mejores servicios profesionales para su explotación. Tan importante es la captura y el análisis de datos, como la adecuada y oportuna capacidad de respuesta de las marcas a los consumidores. Quien más rápido lo haga con un retorno de la inversión cuantificable y genere una relación de valor con los consumidores, tendrá un pie y medio en el futuro. Diría que Amazon, con su oferta de soluciones EMR y Kinesis, ya ha puesto medio. Desde Genetsis, no les perdemos de vista ni un pixel.

 

Más madera para el Big Data

Pedro Parellada, Social CRM Program Manager Genetsis
CTRL, mayo de 2014