La importancia de los errores

Hola,

Hoy me voy a meter en un berenjenal infinitamente mayor a los habituales: voy a hablar de periodismo, política y matemáticas. Con dos cojones y un palo, que se suele decir.

Voy a hablar de un caso concreto, que he querido dejar para mucho tiempo más tarde de que ocurriera para que no parezca que lo hago con fines políticos de ningún tipo. El objetivo de esta entrada es hablar de la falta de ética numérico-matemática (intencionada o no) de los medios de comunicación[1]. Hubiese puesto casos de todas las tendencias para que se cancelasen entre ellos y no se me etiquetase de nada (que en este país somos mucho de etiquetar) pero ninguno es tan interesante como éste y tampoco me entrarían todos los que me he encontrado.

Bien, este caso se debe a una manifestación que hubo en Madrid con el tema de Podemos y esas cosas en la que, como siempre, los diferentes medios de comunicación, policía, etc se pelearon por decir cada cual una cifra de asistentes más… “creativa”.

El caso que vamos a estudiar es el del periódico “El País”.

En este periódico se curraron bastante el cálculo de asistentes a la manifestación e incluso hicieron un gráfico sobre el mapa de la zona en la que ocurrió. Aquí tenéis la imagen del estudio (todos los derechos de la imagen les pertenecen y esas cosas):

Foto tomada de: http://elpais.com/elpais/2015/01/31/media/1422734596_211375.html

Foto tomada de: http://elpais.com/elpais/2015/01/31/media/1422734596_211375.html
(Podéis clickar para verla más grande)

Y ésta es la noticia:

http://politica.elpais.com/politica/2015/01/31/actualidad/1422673981_619047.html

Por lo que entiendo de la foto, el estudio lo realizaron de la siguiente manera:

  1. Asignaron una densidad de asistentes por metro cuadrado a cada zona tomando como referencia una foto aérea.
  2. Multiplicaron la densidad asignada por la superficie aproximada de la zona.
  3. Sumaron los asistentes calculados en cada zona.
  4. Lo colocaron todo en un gráfico muy chulo.

A simple vista, el procedimiento parece adecuado, al menos para la gente normal. Sin embargo, un conocimiento mínimo de matemáticas o, en su defecto, sentido común echa por tierra el cálculo.

Para empezar la diferencia existente entre el cálculo realizado por los organizadores, la policía y el realizado por “El País” ya empieza a hacernos sospechar pero esto no es lo más interesante.

Siguiendo el procedimiento que he propuesto del cálculo (que si no ha sido así, por favor, que alguien me explique cómo lo han hecho):

En el primer punto, a no ser que los asistentes estén repartidos de forma completamente homogénea en cada zona, es imposible acertar exactamente la cantidad de personas por metro cuadrado (densidad de participantes) por lo que se entiende que se trata de un “cálculo estadístico” posiblemente realizado a ojímetro[2].

En el segundo punto, multiplican esta media por la superficie de las zonas que, de nuevo, está calculada basada en una simplificación, a no ser que las personas estuviesen totalmente alineadas en formas exactas. La imagen insinúa que han simplificado las zonas en las que había manifestantes para poder hacer un cálculo aproximado de la superficie.

Tercer punto. La suma está bien hecha, comprobado.

Y para terminar, el gráfico es una maravilla. Queda genial. No hay sarcasmo aquí, me parece realmente bueno y sería muy explicativo si el resto lo acompañase en calidad.

El problema que veo a todo el procedimiento es que el único objetivo de este cálculo es acompañar la noticia de unos números, no sé si para asustar a la gente o para dar sensación de veracidad. Así que me planteo unas preguntas a mala leche:

Si el cálculo es tan sencillo como mostramos y no requiere de herramientas especiales para hacerlo, ¿por qué la policía y los organizadores hacen un cálculo tan inexacto (y tan redondito) en comparación con éste?

En la noticia se dice lo siguiente: “Según los cálculos de este diario, a la una de la tarde había unos 153.000 manifestantes”. ¿Por qué no se habla de “unos 153.200”? ¿O de “unos 100.000”, como dice la policía?

O, lo que es más importante: Si la superficie de la zona H o la L hubiese sido un metro cuadrado más grande, ¿Habría 153.235,5 personas en la manifestación?

Podría pasarme así tooodo el día y todo se debe a que la manera en la que se ha tratado todo esto es un completo desastre. El enfoque es bueno pero los datos no sirven para nada.

Todo esto ocurre porque no se hace ningún tipo de análisis del error que se puede haber cometido y esto es obligatorio si se quiere hacer un cálculo razonable. El problema es que el 90% de las personas que vean la imagen opinarán que se lo han currado un montón porque han hecho magia matemática y han calculado hasta la unidad, aunque lo que han hecho ha sido trampa, como viene siendo habitual en los medios de comunicación.

En la misma situación, con los mismos datos, este cálculo podría haber tenido sentido si:

  1. Se hubiese calculado el posible error de las medias de personas por metro cuadrado:
    Para esto basta con tomar varias muestras de cada zona, asignar la media de personas por metro cuadrado al valor y la desviación estándar (o desviación típica) de las muestras al error de la siguiente manera:
    Densidad=M_{personas}\pm \sigma_{personas}
  2. Se hubiese calculado el posible error del área de las zonas:
    Este caso es ligeramente más difícil, aunque nada que se escape a la capacidad de un periódico. Habría que haber tenido en cuenta el error cometido al realizar las medidas en las que se base el cálculo de la superficie. Como serían en un rectángulo la base y la altura. Y calcular el error de la superficie a partir de estas. Jugando un poco con teoría de errores se puede hacer sin demasiada complicación.
  3. Se hubiese acotado la cifra final combinando los datos anteriores con sus respectivos errores:
    Simplemente siguiendo con la misma filosofía el resultado final tendría la forma que nos interesa (un valor y un error) y daría una información de la precisión del cálculo realizado.

De esta forma, el cálculo final hubiese sido correcto y hubiésemos sabido entre qué cantidades podría oscilar el resultado. Conoceríamos la precisión del procedimiento.

Además, cuando se tratan casos con cierto error, se suele redondear la cifra aun valor que tengamos seguro, es decir, si ponemos 15.000 será que pueden ser entre 15.000 y 15.999, pero el 15 es seguro. Por eso ocurre que a veces, seguro que lo habéis visto un montón por ahí, se ponen medidas con un cero a la derecha después de la coma tal que así: 256,090. Esto indica que a partir de ahí no se sabe lo que habrá, pero aseguran esa precisión, con el cero incluido. El caso de la policía y la organización, sin entrar en que lo que han calculado no sea coherente, sí que dicen 100.000 o 300.000, expresando que las 5 últimas cifras pueden tomar otros valores, pero que siempre habrá 6 cifras, y la más significativa será 1 o 3 respectivamente.

Sin embargo, nuestros amigos de El País no hacen eso, si no que ponen la cifra exacta (más bien entera, de exacta tiene poco) en la foto, por lo que no se sabe si la cifra oscila entre 153.000 y 154.000 o entre 100.000 y 200.000. Como veis, la cifra que se nos da encaja en ambos casos. Como digo más arriba, en la noticia se habla de refilón de “unos 153.000” pero tal y como se han hecho los cálculos podemos sospechar que no han seguido el criterio del párrafo anterior para decir esto y que, más bien, se trata de un “redondeo estilístico” en lugar de funcional. Así que no podemos saber si realmente se trata de esos 153.000 o si podrían haber sido 14 millones (o 10 colegas) aunque de haber hecho el procedimiento de forma correcta sí que lo sabríamos.

Además, voy a poner un par de ejemplos para demostrar la inestabilidad del cálculo, porque he dicho un poco a la ligera que han redondeado sin pensar:

Suponiendo que el cálculo de las superficies es perfecto (sorprendentemente, ya que todas tienen un área sin decimales) el simple hecho de suponer 0,3 personas más por metro cuadrado (menos de un tercio de persona más por metro cuadrado) implica que el número final aumente en 17.160,6 personas exactamente, haciendo que el resultado sea de: 170.393,6 personas. Que ya dejan de ser “unas 150.000”, son unas poquitas más, ya se podría hablar de “unas 200.000”, en términos periodísticos.

Si nos vamos al otro lado, tirando ligeramente hacia abajo, si volvemos a suponer que las superficies son exactas (que no lo son ni de coña) y quitamos esas dos mitades de persona que se nos cuelan en las zonas H y L, reducimos la cantidad de gente a: 148.061 personas. Es decir, quitando dos medias personas (que parecían puestas a lo loco) nos cargamos 5.172 del total.

Esto deja en evidencia la inestabilidad de los cimientos en los que se sustenta todo el procedimiento. Lo que se vuelve aún más peligroso cuando no se hace un análisis del error que se está cometiendo.

Tampoco quiero alargarme demasiado en el tema porque no soy un gurú de la teoría de errores, simplemente me llama la atención cómo puede haber gente que haga este tipo de cálculos y se quede orgullosa sin saber en cuánto se está equivocando.

No puedo saber si está hecho a mala fe, con ánimo de engañar, o es simplemente falta de conocimientos y tampoco sabría decir cual de las dos es más excusable.

Sin más. Si veis mediciones sin errores, sospechad.

Buenas noches.


[1] Sí, me he inventado el término.

[2] Ojímetro: “A puro huevo”. Como le llamamos en mi pueblo a calcular “a ojo”, sin medir.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s