Por Chris Danforth, Peter Sheridan Dodds y Murali Doraiswany

¿Cómo medimos el bienestar de una población en tiempo real? Tradicionalmente, lo hemos hecho con una combinación de indicadores económicos clave, desde el PIB hasta los índices de confianza del consumidor.

Pero, ¿las personas son felices? ¿Sienten que sus vidas, sus historias personales, van bien? ¿Tienen esperanzas para el futuro?

Más de 2 mil millones de personas usan las redes sociales como Twitter, WeChat, Facebook e Instagram para expresarse. ¿Puede esta información utilizarse como una muestra para medir la felicidad colectiva diaria?

El Laboratorio de historia de la informática (codirigido por Peter Sheridan Dodds y Chris Danforth) así como otros grupos están trabajando para desarrollar un “hedonómetro”, una medida de la felicidad en tiempo real con el poder de un índice económico importante, utilizando los datos de las redes sociales.

¿Qué revelan nuestros tuits sobre nosotros?

Nuestro análisis de un subconjunto representativo de tuits en inglés revelan que, a lo largo del día, las personas usan palabras más felices por la mañana, y los insultos aumentan a medida que transcurre el día: lo que llamamos “desenvolvimiento diario de la mente humana”. Vemos un ciclo semanal consistente en el que el sábado tiende a ser el día más feliz de la semana, porque es el día en que más aparecen palabras como “amor”, “familia” y “diversión”. Los lunes y los martes son puntos bajos, con menos “ja ja ja”, “impresionante” y “jugando”.

La atención colectiva a los acontecimientos importantes produce grandes picos y caídas en la felicidad. Los datos de EU muestran que las festividades tienden a ser los días más felices, y en Navidad y víspera de Año Nuevo es cuando más aparecen palabras como “esperanza”, “bendición” y “alegría”, y menos “no” y “odio”. Hallazgos similares es probable que aparezcan en la celebración del Diwali en Mumbai o durante el Año Nuevo chino en Beijing. Al parecer, las personas necesitamos celebraciones organizadas y estructuradas para unirnos en torno a sentimientos positivos.

Del mismo modo, a nivel de subpoblación, las grandes bases de fanáticos explotan de forma inesperada cuando su equipo gana un campeonato deportivo importante (por ejemplo, el Super Bowl en los EU); mientras que los tweets de los fanáticos del equipo perdedor son tristes y muestran su enojo.

Los días más tristes responden a las grandes conmociones a nivel del sistema. Los desastres naturales como los terremotos y el tsunami en Indonesia, las muertes de celebridades como la de Michael Jackson y los ataques terroristas como los ocurridos en París generan días extremadamente negativos. Los datos de redes sociales geoetiquetados permiten que este análisis se reduzca a zonas geográficas específicas, como una ciudad o estado.

grafica Twitter, Twitter

Gráfica: Bases de datos de las curvas (timeseries) de felicidad diaria en los tuits en inglés, extraídos de una selección aleatoria del 10 % de los mensajes publicados en todo el mundo. Versión interactiva disponible en http://hedonometer.org

¿Pueden las redes sociales proporcionar indicadores de la salud de la población?

Los hedonómetros basados ​​en las redes sociales también ofrecen fuertes correlaciones con algunas mediciones tradicionales de la salud y el bienestar.

Por ejemplo, en un estudio reciente, palabras y frases específicas en los tweets mostraron fuertes correlaciones con las tasas de obesidad y diabetes en los EU: los estados donde las personas publicaban tweets sobre correr, esquiar y caminar tenían niveles más bajos de estas enfermedades. En otro estudio de tweets públicos geoetiquetados de alrededor de 1,300 condados de los Estados Unidos, los tweets que transmitían emociones negativas (por ejemplo, ansiedad u hostilidad) se correlacionaron con los datos de la tasa de mortalidad por enfermedades cardíacas en estos mismos condados (proporcionados por los Centros para el Control y la Prevención de Enfermedades). Otro análisis de los tweets publicados por 1,400 usuarios con TDAH reveló que el grupo publicó más mensajes relacionados con la falta de concentración, autorregulación y expresiones de agotamiento mental, físico y emocional en comparación con un grupo de control sin esta enfermedad.

Los análisis de fotos de Instagram de 166 individuos identificaron con éxito marcadores de depresión: los sujetos deprimidos tendían a publicar fotografías más azuladas y oscuras (a un nivel de píxel por píxel) que los sujetos no deprimidos.

Y los investigadores de Microsoft recientemente reportaron que las consultas de los motores de búsqueda pueden identificar algunos casos de cáncer, incluso antes de que las personas reciban dicho diagnóstico. Uno de nosotros (Murali Doraiswany) está trabajando actualmente con el equipo de Microsoft para examinar si los fenotipos de búsqueda en la web (el patrón de consultas) pueden proporcionar pistas sobre los primeros síntomas de enfermedades mentales como Parkinson y Alzheimer.

Con más perfeccionamiento, es concebible que estos “marcadores digitales” sirvan como tableros de mando para la salud pública, ya que brindan información sobre el impacto de las decisiones de los legisladores casi en tiempo real.

¿Cuáles son las desventajas?

Está claro que debemos tener en cuenta lo que aprendimos del aumento y la caída de Google Flu Trends (GFT), un algoritmo para predecir las tasas de gripe basado en las búsquedas en la web, que después de un éxito inicial no logró detectar el pico de la temporada 2013 por un amplio margen (140%). Un análisis posterior reveló que los algoritmos de GFT eran propensos a un “sobreajuste”, dando demasiado peso a los términos de búsqueda que solo se correlacionaban con la gripe por casualidad, sin tener en cuenta los cambios en el comportamiento de búsqueda a lo largo del tiempo.

El análisis de los sentimientos y el estado de ánimo a través de las redes sociales aún se encuentra en sus inicios. La falta de muestras aleatorias, la incapacidad para analizar los sentimientos profundos (es decir, ir más allá de lo que las personas piensan sobre temas específicos) y descifrar las complejidades de cientos de dialectos nativos son algunos de los desafíos que los investigadores deben superar.

Por lo tanto, es fundamental que dichos instrumentos se puedan sintonizar, mejorar y transparentar, y que no se hagan sobre la base de algoritmos de caja negra. Una asociación entre los sectores público privado podría ser ideal para validar, controlar y perfeccionar dichos instrumentos.

¿Qué viene a continuación?

El desarrollo de hedonómetros basados ​​en redes sociales multilingües, que también cubran otros idiomas como mandarín, árabe, hindi y español, podría permitir un mecanismo de detección de los cambios emocionales en todo el mundo en respuesta a acontecimientos como el Brexit, los partidos de la Copa Mundial de Fútbol, laspruebas nucleares y los movimientos del mercado financiero.

Una base de datos a gran escala de las mediciones de otras emociones basadas en las palabras, además de la felicidad y la tristeza, como el miedo, la ira y la sorpresapermitirían que estas emociones se incorporaran a las versiones futuras del hedonómetro. Incluir texto de otras fuentes en línea como Google o Baidu (qué buscan las personas), y BBC, Xinhua o Times of India (qué leen las personas) puede servir como una perspectiva diferente para explorar las tendencias sociales.

Las agencias de inteligencia de todo el mundo ya han empezado a utilizar estas herramientas, pero sus datos y algoritmos no están disponibles para el análisis o uso público. Creemos que es hora de establecer un marco ético y científico para el uso público de dichos instrumentos, y estamos buscando financiación para crear dicho marco.

A medida que las redes sociales continúan revelando ideas a escala más fina sobre nuestro comportamiento, intentamos dar sentido a los hábitos, las emociones y las historias que compartimos entre nosotros. Al igual que la invención de los relojes, termómetros y telescopios precisos que se usan en tantos campos científicos, la sociedad debería construir instrumentos que desbloqueen el poder de la ciencia para describir y explicar fenómenos sociales, y permitir desarrollos tecnológicos para mejorar a las personas en todas partes del mundo.