¿Qué es una escala logarítmica?

Por Pablo Rodríguez Sánchez

La crisis del COVID19 ha venido acompañada de varios efectos secundarios. A la escasez de papel higiénico y los DJs de balcón se unen otras desgracias, como la omnipresencia de escalas logarítmicas en la prensa.

Pero, ¿qué es un logaritmo*? Aquí viene el primer problema: la definición con palabras cotidianas del logaritmo es casi un trabalenguas:

«El logaritmo del número x es aquel número y tal que 10 elevado a y nos da x»

¿Horrible, verdad? En mis tiempos de profesor, esta otra «definición» siempre me funcionó mucho mejor. El logaritmo de x es la respuesta a esta pregunta:

El logaritmo de x es la respuesta a esta pregunta

 

El concepto queda aún más claro con unos pocos ejemplos:

  • log(10) = 1, porque 10 elevado a 1 es 10
  • log(100) = 2, porque 10 elevado 2 es 100
  • log(1000) = 3, porque 10 elevado a 3 es 1000
  • log(10000) = 4, porque 10 elevado 4 es 10000

¿Y cuánto valdrá, por ejemplo, log(31)?, pues este es más difícil de hacer sin una calculadora, pero es razonable esperar que esté entre log(10) y log(100), esto es, será un número entre 1 y 2. ¿Y log(524)?, pues así, sin calculadora, sólo puedo decir que estará entre 2 y 3.

Aquí viene la observación clave: mientras que x aumentó de 10 a 100, su logaritmo sólo aumentó de 1 a 2. Para llegar a 3, ha habido que esperar a que x llegue a 1000. Al 4 no se llega hasta 10000. En resumen: el logaritmo de x aumenta mucho más despacio que x.

¿Y esto por qué es útil?

Pongámonos en la piel de un epidemiólogo. Cada día están recibiendo datos actualizados del número de casos de infecciones, un número que, por desgracia, crece cada vez más rápido en las primeras fases de la epidemia. Si representamos información como esa en escala lineal (la escala a la que todos estamos acostumbrados), los datos correspondientes a hace unos días quedan completamente opacados por el enorme tamaño de los actuales. La escala logarítmica arregla esto, como mostramos en la imagen de abajo.

Simulación (sin valor predictivo alguno) del número de personas que han sido infectadas, en escala lineal y logarítmica. Los datos en ambos gráficos son exactamente los mismos. La escala, en cambio, es lineal en el gráfico superior y logarítmica en el inferior

Esto es especialmente importante cuando se comparan resultados entre, por ejemplo, diferentes países. Estos días todos hemos oído expresiones como «España está en la misma situación que Italia hace unas semanas». Si queremos visualizar esto gráficamente, representando los datos en escala lineal no vamos a ver gran cosa, mientras que en escala logarítmica vemos todo más claramente (ver abajo). Y, al menos lo que yo veo, no resulta del todo tranquilizador.

Situación a 19 de Marzo de 2020. Imagen de John Burn-Murdoch

Para los que quieran hilar más fino

El lector más inquisitivo se estará preguntando: ¿y por qué el logaritmo?, ¿acaso no hay otras funciones de x que aumenten mucho más despacio que el propio x? Sí, sí que las hay, pero el logaritmo funciona especialmente bien.

La razón por la que usamos precisamente un logaritmo es porque los epidemiólogos han establecido que la tasa inicial de crecimiento del número de casos es de un 33% diario (lo de tasa inicial es importante, ya que esta tendencia acabará por reducirse**). Esto equivale a multiplicar por 10 el número de casos cada ~8 días. Esto es, el número de casos crecerá inicialmente como 10 elevado al tiempo pasado medido en periodos de 8 días. Esto significa, entre otras cosas, que se tarda el mismo tiempo en pasar de 1 a 10 casos, que de 10 a 100 (8 días en ambos casos).

En escala logarítmica, gracias a la capacidad del logaritmo para «deshacer» potencias de 10, un incremento a tasa fija se convierte en una línea recta (línea punteada en el gráfico de arriba). El objetivo prioritario de las autoridades es hacer que las curvas crezcan más despacio que ese 33% diario lo antes posible. Es decir, que estén menos inclinadas que la línea punteada.

No hablaremos aquí de otros problemones derivados de comparar datos de diferentes países. Entre estos están, por citar algunos ejemplos, los ajustes de la escala temporal (¿cómo comparar dos series de datos si en una la crisis empezó más tarde que en otra?), los ajustes por densidad de población (¿cómo comparar la gravedad de la situación en países con diferente población?) y, quizá el más importante, ¿cómo comparar datos si cada país usa un criterio diferente (y a menudo cambiante) para establecer que un paciente está infectado?


*: hablaré aquí solamente de logaritmos decimales.

**: y no sólo por que se están tomando medidas, sino porque la cantidad de personas susceptibles de enfermar no es ilimitada.


Referencias

  • Hilo de Twitter de John Burn-Murdoch (en inglés), analista de datos del Financial Times.

Fuente: FugaDeCerebros

Comparte este artículo

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *