fbpx
Pablo Querea Gutierrez CC BY-NC-SA

INEGI presenta su nueva herramienta de Big Data para medir estado de ánimo en Twitter

Única a nivel mundial, la herramienta “Estado de ánimo de los tuiteros en México” (versión 2.0) representa el ejercicio de generación de información estadística con más alta frecuencia del Instituto Nacional de Estadística y Geografía (INEGI).

A través de un comunicado de prensa del 16 de enero de 2018, el INEGI abre el acceso a la herramienta que ya está disponible en su página web (en la sección de investigación/estadísticas experimentales), presentando resultados del 1 de enero de 2016 al 15 de enero de 2018. La consulta de resultados puede hacerse con frecuencia anual, trimestral, mensual, semanal, diaria y por hora, en el ámbito nacional y por entidad federativa.

“Estado de ánimo de los tuiteros en México” (versión 2.0) es una incursión del INEGI en el mundo de Big Data, a fin de explorar la utilidad de fuentes no tradicionales de información y vincularlas con la generación de información estadística y geográfica. Representa un trabajo experimental para el “análisis de sentimientos”, con el propósito de interpretar la emotividad que subyace a los mensajes que se publican en la plataforma digital Twitter.

¿De dónde y por qué surgió la herramienta?

En los últimos años, la Organización para la Cooperación y el Desarrollo Económico (OCDE), de la que México es miembro, formuló recomendaciones para captar estadísticamente la Medición del Bienestar Subjetivo, señalando ciertas limitaciones de las estadísticas convencionales para reflejar el progreso y el bienestar social.

El INEGI ha seguido estas recomendaciones y ha implementado mecanismos para generar periódicamente indicadores que sirvan para medir los niveles de bienestar de la población en nuestro país, sin el alto costo de aplicar encuestas anuales de forma presencial.

En un esfuerzo por estar a la vanguardia, desde 2014 el INEGI se dio a la tarea de implementar formas alternativas mediante el análisis de medios sociales, en particular Twitter. Se conformó un grupo de trabajo multidisciplinario con personal del INEGI, INFOTEC y Centro Geo y se contó, además, con el apoyo de la Universidad de Pensilvania y la Universidad de Tec Milenio.

Miembros del grupo de Analítica Computacional de INFOTEC, en colaboración con investigadores del Centro Geo, aportaron los algoritmos de clasificación que fueron usados para determinar el estado de ánimo expresado en millones de tuits. Los primeros resultados de la versión 1.0 fueron publicados por INEGI en 2016.

[contentcards url=”https://736737d3e7.nxcli.net/animo-los-tuiteros-en-mexico/” target=”_blank”]

El reto de la versión 2.0

Las técnicas de aprendizaje de máquina permitieron entrenar a una computadora para replicar el criterio humano en la identificación de la carga emotiva de cada tuit: negativa o positiva. Esto fue posible gracias a que, para la versión 1.0, se contó con el apoyo de los estudiantes de Tec Milenio para realizar más de 300 mil acciones de etiquetado de tuits.

De esta manera, se clasifica cada tuit y a partir de ello se construye un indicador que relaciona el número de tuits asociados con una carga emotiva positiva (tuits positivos) por cada tuit asociado con una carga emotiva negativa (tuits negativos). A este indicador se le llama “cociente de positividad” y se define como el número de tuits positivos entre el número de tuits negativos para una determinada área geográfica en un periodo de tiempo determinado.

El objetivo para la versión 2.0 era poner en una línea de producción todo el proceso utilizado en la investigación científica con la que se generó la primera versión. La 2.0 se distingue, entre otras cosas, porque:

  • Asegura la recolección continua de tuits en paralelo, teniendo un plan de contingencia automatizado para cuando se presenten fallas.
  • Todas las madrugadas hace la interpretación automática de la carga emocional (positiva o negativa) de los tuits recolectados en el día.
  • Almacena diariamente los tuits etiquetados (según su carga emotiva) en una Base de Datos NoSql, y procesa y agrega los tuits dejando disponibles los resultados para ser consultados.
  • Logra una aplicación web consultable en cualquier plataforma, incluidos teléfonos móviles.
  • Incluye enlace al “Pioanálisis” que es la aplicación en la que, de manera divertida, se clasifican manualmente nuevos tuits. Con ello, el público puede ayudar voluntariamente a clasificar tuits, los cuales formarán parte de un conjunto de entrenamiento siempre en crecimiento.

El “cociente de positividad” en los sismos

La sensibilidad del estado de ánimo de los tuiteros en México para captar de manera automática el impacto emotivo de cambios relevantes en el entorno se puso a prueba con los recientes sismos del 7 y 19 de septiembre de 2017, que afectaron a varias entidades federativas del país. Tanto el 8 de septiembre como el 19 de ese mes presentaron bajas importantes en el cociente de positividad en la serie nacional (con frecuencia diaria) y mostraron el cambio del estado de ánimo de los tuiteros, justo a partir de la hora en que ocurrieron los sismos.

La herramienta permite visualizar las reacciones diferenciadas por entidad federativa: mientras que la Ciudad de México presenta notables bajas en la positividad tanto el 8 como el 19 de septiembre, en Chiapas sólo se observa esa caída el día 8 y en Chihuahua no se aprecian cambios importantes en alguna de las dos fechas.

Conoce aquí los resultados de la herramienta en su versión 2.0, incluso por hora

[contentcards url=”http://www.beta.inegi.org.mx/app/animotuitero/#/app/multiline” target=”_blank”]

Comentarios de Facebook