El Big Data, ¿nos viene aún grande?
El futuro nos depara sorpresas, seguro. Y muchas de ellas vendrán de la mano del Big Data. Image: REUTERS/Sukree Sukplang
“Todos los días generamos 2,5 trillones de bytes en datos; el 90% de los datos del mundo acumulados a día de hoy se han creado en los últimos dos años.” Son algunas de las constataciones que nos proporciona SINTEF, la mayor organización de investigación independiente de los países escandinavos.
“Cada hora se pueden procesar una media de 60 millones de transacciones procedentes de cerca de 2.000 millones de tarjetas en 220 países, a través de más de 40 millones de comercios” y, sin embargo, “el 90% de todos los datos que generan dispositivos como smartphones, tabletas, vehículos y electrodomésticos conectados nunca se analiza… la mayor parte de ellos empiezan a perder valor en cuestión de milisegundos…” afirman investigadores de IBM.
Como ya se sabe, a esto ahora lo llamamos “Big data”, que no es sino ese inmenso volumen de información personal que, en formato digital, vamos dejando en los cada vez más numerosos dispositivos de nuestra interconectada vida. Para situarnos un poco mejor en la realidad del Big Data hay que recordar, por ejemplo que, por muy digitales que sean, tales bits necesitan un espacio físico donde guardarse: son los Data Center, uno de cuyos mayores problemas, por cierto, es algo tan prosaico como la refrigeración de sus potentes servidores, lo que está acelerando proyectos de instalaciones submarinas. Facebook, Google… poseen grandes centros de datos por razones obvias; sin embargo alguien vislumbró que ahí había negocio y hoy es Digital Realty la compañía que tiene las mayores instalaciones puesto que se dedica a la adquisición, venta y alquiler de las mismas. Cuando el contenido es tan importante, el continente puede ser muy rentable.
El BIG DATA no es nuevo. Es distinto.
El Big Data es hoy uno de esos fenómenos a los que la sociedad periódicamente debe “enfrentarse”, en el mejor de los sentidos (o no), y que son fruto de su propia evolución y conocimientos. Quizá un equivalente histórico sea la aparición de la imprenta o la de los vehículos a motor. La escritura y la rueda ya existían pero fueron la capacidad de multiplicar la reproducción escrita y la de acelerar el movimiento de la rueda lo que introdujo un cambio sustancial en su uso y su influencia. La información personal organizada y acumulada, de manera similar, también existía antes del Big Data.Acerquémonos a la sacristía de cualquier Iglesia y comprobaremos cómo allí se conservan registrados datos personales por décadas e incluso siglos. No digamos en un Registro Civil o Notarial. Es la historia, nuestra historia, lo que ni más ni menos, se va conformando con tales anotaciones. Un Museo es también un “Little Data” temático, allí donde se guardan los restos de nuestro pasado que ayudan a entender nuestro presente.
Como de forma acertada afirma Chris Meyer, en el recorrido de los datos a la sabiduría existen dos peldaños intermedios que son la información y el conocimiento. Pues bien,el Big Data viene a ser un atajo que facilita precisamente la conversión de la pura información, como cúmulo de datos simplemente reunidos y medianamente organizados, en conocimiento, o sea en el “dominio” útil de tal información una vez analizada y estructurada para un fin determinado.
Al menos, esa es la teoría. En realidad el mundo del Big Data aplicado exige algunos requisitos so pena de aceptar el caos como magnitud atractiva y útil.
El BIG DATA al “Useful Data”.
Pongámonos en el caso de una empresa, quizá pequeña o mediana, que quiere aproximarse al mundo del Big Data y empezar a vislumbrar su uso. En primer lugar es imprescindible, como condición sine qua non, la accesibilidad a los datos.
Una de las realidades que los expertos vislumbran en un futuro próximo es el incremento drástico del comercio de datos. De acuerdo con Statista, el valor de mercado del Big Data en 2015 fue de 11 mil 957 millones de euros, y se estima que en 2016 sea de 15 mil 732 millones de euros. En otras palabras, nuestros datos tienen un reflejo económico más que considerable. El “I agree” que de manera refleja clicamos en redes, webs de e-commerce, buscadores etc. es su puerta de entrada a nuestra información y ésta pasa a ser un producto tan apetecible como valioso.
Pero nuestra Pyme, aunque podría acceder a este comercio, quizá prefiera empezar por algo más a su alcance, por ejemplo, su propia base de datos de clientes, o la información contenida en su servicio post-venta, o en los reports comerciales. Eso son datos que cumplen con el primer requisito de accesibilidad.
El segundo paso es el análisis (recordemos que hay que pasar de la información al conocimiento). Eso, entre otras cosas, consiste en lo que los expertos llaman “eliminar el ruido”, porque la condición de “dato” no es en si misma una garantía de utilidad. En el ejemplo, nuestra empresa debería contrastar sus ficheros para eliminar nombres erróneos, personas fallecidas, teléfonos fallidos etc. Se trata de aplicar unos filtros de puro sentido común que, en buena medida, pueden automatizarse.
Y el tercer paso es contextualizar la información que poseemos. En sectores como la Banca y respecto al uso que los clientes hacen de sus tarjetas de crédito, es básico conocer no solo el volumen global de compras, o la cantidad de intercambios realizados sino las circuntancias en que se realizan aplicando parámetros sociodemográficos, geográficos, temporales, etc.
El Big Data y su “cadena de montaje”
Pues bien, si a partir de dos requisitos previos como son su volumen y su variedad, ya poseemos los datos, los hemos filtrado y situado en un contexto preciso, nos topamos con la necesidad de procesarlos. Cuando hablamos de Big Data con su significado real, o sea de una gran cantidad de información, se aplica la llamada “computación distribuida” que no es sino el reparto de tal masa de datos entre distintos procesadores para luego agrupar el conocimiento extraído.
Empresas como Google aplican su propio modelo de procesamiento, llamado Map Reduce, a cuyo resultado accedemos los usuarios al consultar Google Trends o Page Rank, por ejemplo. En código libre está HADOOP y la Universidad de Berkeley, por su parte, desarrolló Spark, entre otros.
¿Y cuál es el resultado de todo este proceso? En pocas palabras: convertir datos en valor mediante la combinación, como hemos visto, de procesos digitales y análisis racionales, y todo ello para alcanzar el conocimiento útil para una mejor toma de decisiones empresariales. El Big Data, por tanto, no es nada si no es “para”. Solo es valioso en razón de una finalidad que vaya más allá de su simple contemplación. De lo contrario estaríamos en la posición del avaro que se conforma con observar sus tesoros mientras vive en la miseria.
El futuro nos depara sorpresas, seguro. Y muchas de ellas vendrán de la mano del Big Data. Algunas ya comienzan a intuirse, en relación con la salud, la seguridad, el mercado e incluso los deportes. Otras ni las imaginamos. Los seres humanos inmersos en la civilización actual somos especialmente fecundos en dos cosas que generamos y difundimos con una incontinencia imparable: desechos y datos. El reto, ya en marcha, es controlarlos para minimizar sus efectos negativos, y “domesticarlos” para hacerlos valiosos en una forma vida que habrá de apoyarse en una fructífera gestión de la realidad antes que en la ficción.
No te pierdas ninguna actualización sobre este tema
Crea una cuenta gratuita y accede a tu colección personalizada de contenidos con nuestras últimas publicaciones y análisis.
Licencia y republicación
Los artículos del Foro Económico Mundial pueden volver a publicarse de acuerdo con la Licencia Pública Internacional Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0, y de acuerdo con nuestras condiciones de uso.
Las opiniones expresadas en este artículo son las del autor y no del Foro Económico Mundial.
Mantente al día:
Macrodatos
La Agenda Semanal
Una actualización semanal de los temas más importantes de la agenda global