El romance entre Twitter y la ciencia
Image: REUTERS/Brendan McDermid
Aunque sus valores estén a la baja y nadie parezca querer comprarla, Twitter, la red social del pajarito azul, supera los 300 millones de usuarios activos al mes. En un segundo se generan unos 6.000 tuits, 350.000 al minuto, 500.000.000 cada día. Muchos pueden decir chorradas insustanciales o insultos a personas muertas, pero otros son descripciones de cosas que están pasando, comentarios de actualidad o estados de salud. ¿Resulta difícil de creer que algunos individuos hayan decidido analizar estos mensajes para ayudarles en sus investigaciones?
«Twitter y las otras redes sociales están entre los más grandes archivos de actividad humana existentes y, al contrario que con las encuestas, ahora tenemos la posibilidad de analizar millones de mensajes, opiniones e interacciones de personas en diferentes contextos como la política, economía o el ocio», explica el matemático Esteban Moro, investigador en la Carlos III de Madrid. «Esto nos ha permitido estudiar fenómenos que antes eran imposibles de medir, como la discusión en tiempo real sobre temas de política o los movimientos de millones de personas en un país».
Por ello, arguye, los estudios para los que Twitter es mas útil son los que se ubican en un espacio acotado, como una ciudad o una región, o en un tiempo determiando, como un periodo electoral o los desastres naturales. Fue justamente en este segundo aspecto donde Moro hizo su investigación, estudiando la actividad en Twitter durante el huracán Sandy en EE UU, causando 147 muertos, dañando 650.000 edificios y con un costo final de 50.000 millones de dólares.
«Mientras que para medir el impacto económico de un desastre natural como este han tenido que pasar dos años, mediante el uso de una herramienta como Twitter hubiésemos tardado dos semanas», asegura. Lógicamente, sólo se fijaron en los tuits que contenían determinadas palabras clave como sandy, storm, hurricane o frankenstorm y acabaron llegando a una base de datos formada por 9,7 millones de tuits localizados geográficamente de 2,2 millones cuentas.
«Lo que vimos es que el número de mensajes per capita en los códigos postales de New Jersey está correlacionado con el impacto económico del desastre, que se mide calculando el importe de ayudas federales y reclamaciones al seguro», continúa, «la conclusión más importante es que, aunque imperfecta, la observación de la actividad en Twitter justo durante el desastre natural puede dar una idea de la severidad de los daños y del impacto económico del desastre, sirviendo como una primera herramienta para valorar donde se van a necesitar más los recursos y las ayudas».
De acuerdo con un post publicado por Twitter en 2015, la red social tiene múltiples aplicaciones científicas. El profesor John Browstein usa sus datos para entender mejor el sistema de salud publica. La ciudad de Santa Mónica ha lanzado el proyecto Wellbeing, en el que usa las intereacciones en Twitter de sus habitantes para entender qué le preocupa a sus ciudadanos y medir su felicidad.
Otro estudio, titulado She Said Yes! — Liminality and Engagement Announcements on Twitter, observaba cómo cambiaba el comportamiento y lenguaje de las parejas recién prometidas. Aunque como en todo hay un pero. Y en Twitter, como en las encuestas, lo podríamos llamar el sesgo.
«La muestra en Twitter está sesgada a las grandes capitales mundiales, donde hay un mayor uso de dispositivos electrónicos per capita, por lo que está la disyuntiva de sólo tener en cuenta a aquellas que son activos en la red social», advierte el mexicano Carlos Adolfo Piña, doctor por la Escuela de Ciencias de la Computación e Ingeniería Electrónica en la Universidad de Essex. «Pero aunque quizá a no se pueda tomar una muestra mundial rigurosa, si que se puede usar una muestra electrónica que nos sirva como un anticipador o sensor social para percibir el sentir de nuestro alrededor».
Como ejemplo, Piña cita los fallos de las encuestas en los diversos comicios y el acierto de Twitter, como el estudio de Nick Beauchamp, un profesor de Ciencia Política en la Northeastern University. En él aseguraba que su análisis de 100 millones de tuits durante el ciclo electoral en EEUU en 2012 se acercó más al resultado final que las encuestas. «En comparación con los años anteriores, cuando había que confiar en una encuesta realizada por personas, Twitter nos da una respuesta más rápida y una idea de qué puede estar pensando la sociedad con respecto a un evento o fenómeno social», razona.
En su caso, Piña estudió el potencial de la red social para acercarse a temas tan variados como la salud, el medio ambiente, la ecología, el agua o la violencia y, podría decirse, ha desarrollado una metodología. Primero arma un grupo multidisciplinar para después, en mesas de trabajo, analizar las palabras clave, que representan el conocmiento empírico de un tema y cómo se expresa la gente algunos de sus conceptos. «En el caso de la epidemia de chikunguña, Dengue o Zika, en México las personas escriben Chinguya en lugar de chikunguña», ejemplifica, «este tipo de detalles finos ayudan mucho a la investigación».
Ya con la lista de las palabras mágicas, se van afinando las búsquedas para ir viendo si el tema es demasiado abstracto o es viable realizar una investigación. Con el programa ya preparado, se extraen tuits diariamente para ver qué cantidad de información se puede llegar a tener en un par de meses o en un año, según lo que se necesite. Puede parecer que es muchísima información, pero aquí Piña habla de la paradoja del Big Data.
«A pesar de la cantidad masiva de datos que fluye en la Red, no todos son datos útiles o de calidad», parafrasea, «lo que al final nos lleva a seguir trabajando con Small Data, ya que muchas veces después de la limpieza de la información, la cantidad de datos se reduce significativamente y lo que antes parecía mucho ya no es tanto». Algo que ocurre en el propio Twitter, una vez que le quitas las tonterías y los insultos gratuitos.
No te pierdas ninguna actualización sobre este tema
Crea una cuenta gratuita y accede a tu colección personalizada de contenidos con nuestras últimas publicaciones y análisis.
Licencia y republicación
Los artículos del Foro Económico Mundial pueden volver a publicarse de acuerdo con la Licencia Pública Internacional Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0, y de acuerdo con nuestras condiciones de uso.
Las opiniones expresadas en este artículo son las del autor y no del Foro Económico Mundial.
Mantente al día:
Tecnologías emergentes
La Agenda Semanal
Una actualización semanal de los temas más importantes de la agenda global
Puedes anular tu suscripción en cualquier momento utilizando el enlace que figura en nuestros correos electrónicos. Para obtener más información, consulta nuestro Política de privacidad.
Más sobre Tecnologías emergentesVer todo
Matt Price and Anna Schilling
26 de noviembre de 2024