Big data para los problemas del desarrollo
¿Cómo podemos contener las enfermedades que se propagan rápidamente, como el ébola y el H1N1, la llamada gripe porcina?¿Cómo podemos asegurarnos de que los refugiados que habitan en albergues después de los desastres naturales estén sanos y protegidos contra el abuso? ¿Hay cómo predecir y prevenir de mejor manera cualquier situación, desde el desempleo a los disturbios a la guerra civil?
El análisis de grandes datos para el desarrollo tiene el poder de resolver estos y otros problemas aparentemente insolubles. Pero para que el análisis pueda producir información útil, debemos contar con datos que puedan alimentar los modelos. Dicho de otra forma, los datos son el líquido que impulsa los algoritmos.
Afortunadamente, el suministro está ahí: a diario estamos generando suficientes datos para ayudar a contestar estas preguntas y más. Pero existen inquietudes justificables acerca de cómo proteger la privacidad al usar dichos datos. Por ejemplo, si una ONG quiere observar los movimientos de poblaciones para comprender mejor cómo evitar las enfermedades, ¿cómo podría obtener datos de geolocalización y usarlos de una manera que pueda salvaguardar la privacidad individual?
La respuesta puede estar en la portabilidad de modelos de datos. La práctica anterior consistía en entregarles los datos a los gobiernos y a las ONGs para que los analizaran, pero los grandes conjuntos de datos son difíciles de manejar y, entre más se transportan, más grande es el riesgo potencial a la privacidad y más grande la posibilidad de abuso. Un método más moderno es “darle vuelta a la página” al llevar el modelo a los datos.
Una vez que se desarrolla un modelo analítico, tiene sentido exportar el modelo en lugar de importar los datos. Así, los datos pueden analizarse en las ubicaciones seguras donde ya residen, dándoles en esencia a los dueños de los datos las llaves para abrir la información que radica en los mismos. A esto le llamo un laboratorio de modelos. Este método de abordar el análisis de grandes datos dirigido por el modelo tiene el potencial de ofrecer una mayor eficacia al tratar de resolver preguntas conocidas y probar hipótesis. Los laboratorios de modelos basados en un núcleo son un método complementario al método de laboratorios de datos basados en el campo que ayudan a revelar las preguntas que no sabíamos que teníamos que preguntar.
Lecciones de un súper tifón
La industria del análisis ya está avanzando hacia este objetivo. Como lo mencioné en la última entrada de mi blog, los esfuerzos de recuperación de un tifón son un buen ejemplo. Cuando el súper tifón Haiyan arrasó Filipinas en noviembre de 2013, miles de personas murieron y cientos de miles quedaron sin hogar.
A fin de coordinar servicios básicos, la Organización Internacional de la Migración (OIM) necesitaba datos de los movimientos de ciudadanos. Al usar análisis, la OIM pudo visualizar los datos y, en cuestión de horas después de haber unido los datos y la tecnología, llegar a preguntas que no se había planteado anteriormente. Las respuestas no siempre fueron intuitivas. Por ejemplo, la OIM descubrió que una de las ciudades más afectadas no necesitaba alimentos ni agua tanto como diesel para echar a andar los generadores de los hospitales y ayudarles a las personas a evacuar la isla.
El caso de la OIM demuestra cómo el análisis puede reducir en gran medida el tiempo necesario para obtener información útil, pero se puede hacer más. En lugar de llevar la tecnología a los datos, sobre todo al lidiar con datos grandes o sensibles que no son fáciles de transportar, simplemente ofrezcámosles los modelos a nuestros compañeros para evitar retrasos en la obtención de respuestas. Esto ampliaría también la participación de socios no tradicionales, como los proveedores de telecomunicaciones, que tienen la capacidad de operar modelos con sus datos, incluso cuando estos permanezcan en su lugar y sean anónimos. Cuando organizaciones como la OIM tienen modelos de predicción, la organización puede optimizar las rutas de evacuación o dar pasos para salvaguardar la seguridad de las mujeres en los refugios, y pueden hacerlo antes de que el problema surja. Como el tifón Hagupit de este año lo comprueba, la necesidad nunca tendrá fin.
Por supuesto que, aparte de la ayuda en casos de desastres, exportar modelos es útil en otras ocasiones. Ya sea combatiendo el ébola o ayudándoles a los refugiados desplazados por la guerra, en cualquier momento en que los datos sean sensibles, tiene sentido trasladar el modelo. Como lo están aprendiendo los científicos de los datos, las preguntas pueden ser mucho más portátiles que los datos necesarios para proporcionar respuestas. Mi compañía está trabajando en ese tipo de plan, y hago un llamado a mis colegas de la industria a hacer lo mismo. Mientras que anteriormente el análisis solía ser exclusivamente dirigido por los datos, ahora es cada vez más dirigido por los modelos: la pregunta indica el camino a los datos relevantes. Y a menudo dichos datos residen fuera de las fuentes convencionales y dentro de muros patentados y de privacidad protegida. Es por eso que enfocarse en el modelo tiene sentido. El análisis dirigido por modelos nos permite pedir y buscar, por medio de una colaboración abierta distribuida (crowdsourcing), las respuestas a las preguntas multicientíficas más complejas que elevarán la condición humana.
Autor: Mikael Hagstrom es vicepresidente ejecutivo del SAS Institute; vicepresidente del Consejo de la Agenda Global sobre el Desarrollo Dirigido por los Datos. Para aprender más acerca del uso de análisis de la OIM en la recuperación de desastres, visite este sitio web o descargue el PDF.
Imagen: REUTERS/Fabrizio Bensch
No te pierdas ninguna actualización sobre este tema
Crea una cuenta gratuita y accede a tu colección personalizada de contenidos con nuestras últimas publicaciones y análisis.
Licencia y republicación
Los artículos del Foro Económico Mundial pueden volver a publicarse de acuerdo con la Licencia Pública Internacional Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0, y de acuerdo con nuestras condiciones de uso.
Las opiniones expresadas en este artículo son las del autor y no del Foro Económico Mundial.
La Agenda Semanal
Una actualización semanal de los temas más importantes de la agenda global
Puedes anular tu suscripción en cualquier momento utilizando el enlace que figura en nuestros correos electrónicos. Para obtener más información, consulta nuestro Política de privacidad.