/ leximetría

'Qué frío tan…'

Parece que últimamente ha estado haciendo mucho frío. ¡Y claro! ¡Es abril! Lo normal es que llueva, que el ambiente se llene de nubes que no dejan entrar la luz y que la humedad se tome todo. ¿Pero es solo percepción o en realidad está más frío?

La respuesta sencilla

En breve: sí. En estos días está haciendo más frío de lo normal, fundamentalmente porque es abril, pero incluso para un abril bogotano. Y las consecuencias no se han hecho esperar:



Pasados quince días, este abril ha sido el tercer mes más frío de los últimos diez años en la capital:

Y también el segundo abril más frío de los últimos diez años:


No todo termina ahí. El pasado 6 de abril la temperatura promedio en Bogotá fue de 12,3 °C, más de dos grados por debajo del promedio (14,5 °C), por lo que puede considerarse el segundo día más frío de los últimos cinco años:


No ha sido solo cuestión de la temperatura. En un día de lluvia bogotano caen en promedio 5,7 mm de agua por cada metro cuadrado. Pero el 3 de abril cayeron 37,4 mm por metro cuadrado. ¡Fue el segundo día con la mayor lluvia de los últimos diez años!


¿Pero la gente sí tiene razón?

Ya quedaron despejadas nuestras dudas con estos valiosos datos sobre el estado del tiempo que hora a hora, desde 1997, producen las 13 estaciones de la Red de Monitoreo de Calidad del Aire de la Secretaría Distrital de Ambiente de Bogotá. ¿Pero qué tal que no existieran? ¿Podríamos confiar en lo que dice la gente para hacernos una idea de la temperatura?

Hace unos años el profesor Rodrigo Palau, de la Universidad McGill, afirmó que el termostato de los bogotanos está programado para llamar 'frío' a cualquier temperatura por debajo de 19 °C y considerar que al acercarse a los 17 °C podría ser demasiado frío ('qué frío'). Así puede verse en esta útil explicación gráfica:


Sin embargo en WHALE & JAGUAR nos pusimos a la tarea de encontrar cuál es el punto de inflexión en el que la temperatura parece dar para hablar de 'frío'. Para lograrlo buscamos las publicaciones de Twitter que contuvieran la palabra 'frío' y obtuvimos un total de 6557 entre la 1 a. m. del 1 de abril y las 10 a. m. del 13 de abril.

Y encontramos que al agruparlos por rangos de temperatura sucede esto:


Si bien las menciones al frío comienzan a incrementarse notablemente cuando el termómetro comienza a marcar menos de 18 °C, nuestros datos indican que la curva solo comienza a ascender rápidamente en algún momento entre los 12 °C y los 13 °C, lo que revela el pico de intolerancia: 'qué frío'.

Ahora miremos los datos diarios, relacionando la temperatura promedio de cada día de las últimas semanas y la aparición de 'frío' en Twitter:


La tendencia es clara: mientras menor sea la temperatura en Bogotá, más se habla de 'frío'. La correlación podría ser más fuerte si no fuera por ese punto rebelde en el que la temperatura no fue tan baja pero hay tantas menciones de 'frío' como en el día de menor temperatura.

Ese punto que no deja que el modelo se ajuste para hacernos completamente felices es el 3 de abril, fecha a la que ya nos referimos como el segundo día más lluvioso de los últimos diez años, quizá un día en el que la gente habló mucho de lluvia y frío. A propósito, ¿hay relación entre cuánto llovió y qué tanto se habló de lluvia?


Para el caso de la lluvia la correlación es más fuerte que para la temperatura.

Este pequeño ejercicio va más allá de saber si llueve o no, si hace frío o no. Estamos hablando de que si no contáramos con un sistema de monitoreo continuo de variables meteorológicas, con instrumentos precisos, podríamos saber con cierto grado de certeza cuál podría ser la temperatura o qué tanto está lloviendo a partir de lo que la gente dice. Esta técnica es conocida como culturonomía (culturenomics). Pero preferimos llamarla leximétrica.

¿Qué dicen en Bogotá sobre el frío y la lluvia?

Ya sabemos que las publicaciones de Twitter son un indicador de las variables meteorológicas. En WHALE & JAGUAR también podemos establecer qué tantos lugares comunes sobre un tema podrían existir. En otras palabras, qué tan parecido es todo lo que dicen todos.

Para saberlo procesamos 3200 publicaciones de Twitter que hablaban de frío o lluvia con una técnica de machine learning llamada modelado de temas (aunque la encontrarán más fácilmente si buscan topic modeling) y definimos los cuatro lugares comunes principales.

Los ganadores fueron:

«Qué frío tan…»

La inmensa mayoría de tweets (85,7%) se dedicó a calificar superlativamente el frío.

Aunque todo comienza simplemente diciendo:


Otros llegan más lejos:


Y por supuesto hay quienes coinciden con ligeras variantes estilísticas:


Otros optaron por calificativos menos fuertes:


Y otros los combinaron:


Por cierto, no todos la estaban pasando mal:


«Con este frío»

El 6,5% de los tweets hablan de lo especial del frío.

Unos lo usan para establecer las circunstancias en las que lo vivieron (o la canción que no se salía de su cabeza):


Otros hablaron de sus deseos:


Y también sus frustraciones:


Pero este nos gusta porque es el que mejor resume lo que hace el modelado de temas:


«La lluvia»

El 4,6% fue dedicado a la palabra 'lluvia'.

Unos estaban contentos:


Otros no:


«Frío» + enlace

Un 3,2% compartió sus impresiones sobre el frío por medio de imágenes.

Este fue simplemente el más exitoso (la foto es de Yakarta):


Pero curiosamente varios tweets de este tema usaron un lugar común que preferimos no compartir con ustedes. Aquí va una pista de la razón:


Parece bonito. ¿Pero qué aplicaciones tiene?

La reputación de una organización o persona no puede ser medida por instrumentos convencionales, como sí se hace con la temperatura o la lluvia. Esta solo puede rastrearse a partir de lo que dicen las personas, cuantificándolo y formalizándolo para convertirlo en señales que le sirvan para contrastar con lo que más interesa: su desempeño en el mercado. No lo olvide:



Normalmente las organizaciones acuden a encuestas para encontrar cómo se encuentra la salud de su imagen. Pero estas metodologías son costosas y, sobre todo, toman mucho tiempo. Las herramientas de WHALE & JAGUAR le permiten hacer un seguimiento de su reputación a partir de la escucha y clasificación de discurso en redes sociales y convertirlo en señales numéricas en cuestión de minutos para contrastarlas con, por ejemplo, su información de ventas.

No solo una crisis súbita se reflejará justo en el momento en el que suceda, como cuando la gente comienza a hablar del frío o de la lluvia. Si su organización ya usa instrumentos como encuestas, el monitoreo de WHALE & JAGUAR le servirá para conocer el día a día. Si no cuenta con suficientes recursos para organizar un seguimiento permanente por medio de encuestas, WHALE & JAGUAR le ofrece una herramienta a la medida de sus posibilidades.


La foto de la portada es "El aguacero", de Colores Mari (CC BY-SA 2.0).

Miguel Olaya

Miguel Olaya

🔍 investigación y desarrollo de whale & jaguar 💙 milenarismo científico ☔️ entusiasmo actuarial 📉 promotor del promedio móvil

Lee Más