Espacio de opinión de La Palma Ahora
La sobrina, el tío y la estadística
Cuando Tania eligió su opción de bachillerato, no lo hizo porque tuviera ya decididos sus estudios posteriores. Había sido una estudiante con excelentes resultados, tanto en las materias científicas como en las de carácter humanístico, pues para ella el aprendizaje constituía un placer. Sin embargo, lo que más influyó en su resolución, y también en la de sus padres, fue la creencia, socialmente asumida, de que en las actuales circunstancias, la opción de ciencias, posiblemente, le brindaría más oportunidades laborales en el futuro.
Avanzado ya el último curso de bachillerato, comienza a despertar en Tania el interés por la economía, pero le preocupa su desconocimiento de la estadística, que, por imposibilidad temporal, siempre ha sido la parte sacrificada del currículo de matemáticas. Decide, sin embargo, que emprenderá los estudios de Ciencias Económicas, con la certeza de que contará con la valiosa ayuda de un tío de su madre, profesor jubilado precisamente de matemáticas.
—No te preocupes —le dijo su tío—. Estoy seguro de que, restando un poco de tu merecido tiempo vacacional de verano, serás capaz de asimilar los conocimientos básicos que necesitas.
Ya media el mes de julio, cuando Tania y su tío abuelo emprenden la tarea.
—Querida sobrina, tú sabes que soy de la opinión de que la primera lección del profesor debe ser la de exponer una visión global de la materia objeto de estudio. Así que eso será lo primero que haga. Luego, ya irás familiarizándote con las herramientas matemáticas propias de la materia.
—De acuerdo —responde Tania con una sonrisa—, pero no aprovecharás para endosarme un rollo, ¿verdad?
—Bueno, hace tiempo que con quienes más hablo, o, mejor dicho, monologo, es con las plantas del jardín y con los pájaros que nidifican en él. Te aseguro que hasta ahora no he recibido ninguna queja de ninguno de ellos. Pero tú puedes interrumpirme, preguntarme y opinar cuánto quieras en cualquier momento.
—¿No te parece que el jardín es un lugar adecuado para que comencemos? —Y, sin esperar respuesta, el tío se dirige a la mesa situada al amparo de la sombra de una frondosa magnolia.
A requerimiento de su tío, Tania enciende su ordenador portátil y busca en el diccionario de la Real Academia Española el término estadística, que en su tercera acepción dice:
Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas.
—En resumen —dice el tío—, que de lo que trata la estadística es del estudio de una o más características de una población mediante la toma de datos, el tratamiento de los mismos y la interpretación del resultado de esos datos. El término población no solo se refiere a personas. Es un conjunto de elementos —que llamaremos individuos— de cualquier índole: personas, animales, cosas, manifestaciones, observaciones… No obstante, a menudo no es posible estudiar todos los individuos de una población —por su imposibilidad (determinar el número de una especie de ballena), por su costo (conocer la opinión de todos los españoles acerca del uso de la energía solar)…—, por lo que se recurre a una parte representativa de la misma, que denominaremos muestra.
—A ver, tío: cuando los medios de comunicación dan los resultados de una encuesta, se refieren a una muestra, ¿no?
—No, no, se refieren a la población, pero el estudio se ha hecho sobre una muestra de ella.
—No entiendo —dice Tania, con gesto de perplejidad—. Si solo se estudian unos cuantos individuos, ¿cómo se puede decir que el resultado refleja el de toda la población?
—El resultado es totalmente exacto para el conjunto de individuos de la muestra, salvo que se hayan cometido errores en la medida de la característica. El conjunto de datos se suele representar por medio de tablas, gráficos o en unos pocos valores que ayudan a su interpretación. Esta parte del tratamiento de los datos se conoce como estadística descriptiva.
—Sí, tío, pero sigo sin comprender cómo, a partir de la información que aporten los datos de una muestra, se puedan extraer conclusiones sobre el conjunto de datos de una población. La verdad es que me resulta raro.
—Inferir conclusiones para una población a partir de la información de una muestra de ella ya no es un resultado exacto —responde el tío con una sonrisa—. Quiero decir que esa información no está exenta de error, pero ese error se puede cuantificar. Este ámbito de estudio y tratamiento de los datos se conoce como estadística inferencial. Es la que más me entusiasma, ¿sabes?, pero también la que más se presta a la manipulación. Un profesional de la estadística tiene que ser una persona muy honesta.
—Bueno, por lo que intuyo —dice Tania, confiada en que su tío más adelante le aclare mejor ese proceso de predicción— disponemos de herramientas matemáticas capaces de garantizar su rigor.
—Así es, y te anticipo que, a nivel básico y medio, ese instrumental matemático está a tu alcance, de modo que te sugiero que pongas la máxima atención en la comprensión y significado de las diferentes nociones que tendrás que ir aprendiendo. Insisto: es muy importante que tengas claros los conceptos, que los uses con rigor y que los modelos necesarios para la predicción se diseñen con sumo cuidado, eligiendo muestras que representen adecuadamente la diversidad que entraña una población.
—Yo he oído —interviene Tania— que la estadística puede hacer que con unos mismos datos se obtengan distintos resultados y, por lo tanto, diferentes interpretaciones.
—No. Lo que ocurre es que su interpretación, como ya te advertí, es susceptible de manipulación.
—¿Podrías citarme algunos ejemplos, tío?
—Sí. Imagínate cinco personas que ingresan por una actividad 5 000, 6 000, 6 000, 8 000 y 80 000 euros. Aunque aún no hemos visto ningún mecanismo de cálculo, supongo que no tendrás dificultad en saber calcular cuál fue el ingreso medio.
—No, no tengo dificultad. Es como calcular la nota media de varios exámenes. El ingreso medio serían 21 000 euros. No veo ninguna manipulación en eso, querido tío.
—¿Crees que ese valor representa adecuadamente a los distintos ingresos?
—No, claro que no, ni al que más ingresó ni a los que menos.
—Como la media se calcula a partir de todos los datos, cuando hay valores muy distanciados, por exceso o por defecto, no resulta adecuada para representarlos; sin embargo, hay una medida, la mediana, que solo toma en consideración el valor o valores centrales, previamente ordenados, que en este caso es 6 000, que representa mejor a la mayoría de los ingresos. Pues bien —continúa el tío—, alguien, amparándose en que este valor representa mejor la mayoría de los ingresos, y con ignorancia o intencionalidad, podría decir que los ingresos totales de las cinco personas ascendieron a 30 000 euros, dejando ocultos a ojos de cuatro personas 75 000 euros, que estarían en manos de un solo individuo.
—Entiendo —se apresura Tania a intervenir—. Sin embargo, si se toma la media para calcular la totalidad de los ingresos, estos ascenderían a 105 000, que es la realidad. Pero —continúa—, en ese caso, la mayoría de las personas serían conscientes de la gran desigualdad y eso, en alguna situación, no sería prudente que se conociera, ¿verdad?
—Muy bien, Tania. Veo que lo has comprendido. No es un problema de cálculo, ni es un misterio. Se trata de usar e interpretar adecuadamente los medios de que dispone la estadística.
—¿Por qué lo que predicen las encuestas electorales —pregunta Tania— a menudo no coincide con el resultado final?
—Las encuestas sociológicas miden las respuestas a determinadas cuestiones —responde su tío— y, a veces, esas respuestas tienen que ver con la intimidad personal. El voto, para mucha gente, pertenece a esa faceta del ser humano, y no siempre se responde con sinceridad. También suele ocurrir, por razones de costo, que las muestras sean de pocos individuos y no representen bien al conjunto de la población. Puede suceder incluso que el instrumento de medida, es decir, la propia encuesta, sea poco fiable y de dudosa validez. Y, sin lugar a dudas, algunas se manipulan con la intención de influir en el electorado.
—Por lo que me vas diciendo, tío, como en cualquier actividad humana, el rigor y la honestidad deben presidir la tarea.
-Así es. Veamos otra situación. Cuando se estudian dos características de los individuos de una población, muchas veces se descubre que, entre los valores de una y otra, existe una cierta relación, que llamamos correlación. Es decir, que al variar los valores de una de las características, también lo hacen los de la otra, aunque no necesariamente en el mismo sentido. Por ejemplo, cuando crece la renta de los hogares, suele producirse un aumento del consumo, o cuando aumenta el precio de un producto suele generarse una disminución de su demanda. Pues bien —continuó el tío—, hay que tener mucho cuidado si entre los valores de ambas características existe cierta relación de causalidad o dependencia, o sea, que la variación de una pueda justificar, al menos en parte, la variabilidad de los valores de la otra característica. De lo contrario, se trataría de un hecho puramente casual, fortuito.
-Por lo que me dices, en los dos ejemplos económicos que has citado sí parece lógico que pueda existir cierta dependencia entre los valores de ambas características, ¿verdad?
-Exacto. Sin embargo, no es raro encontrar afirmaciones que pretenden justificar que entre los valores de dos características existe una fuerte correlación causal cuando en realidad no es así. No se trata simplemente de situaciones carentes de sentido común, como deducir de unos valores, puramente casuales, una supuesta correlación; por ejemplo, entre el número de gaviotas que se posan en un determinado bajío y el número de accidentes de coches que se produce en la localidad. No, no se trata de situaciones burdas como esta, sino de las que la gente acaba sorprendentemente aceptando.
-¿Me podrías concretar más? No acabo de entender bien a qué te refieres.
-Sí, claro. Supongamos que nos dijeran que, según un reciente estudio estadístico, “en la isla de La Palma, concretamente en el municipio de Garafía, son más frecuentes los accidentes de vehículos todoterreno que los de turismos”. ¿Significa eso que para circular por una carretera de Garafía es más seguro conducir un turismo? ¿Tú qué crees?
-A ver, no sé… Supongo que tiene que ver con la mayor cantidad de vehículos todoterreno que habitualmente circulan por las vías de ese municipio —responde Tania, un tanto dubitativa—, y no tanto con el tipo de vehículo que se conduce.
-Exacto, pero, lamentablemente, entre muchas personas se instala la idea, inexplicable, de que conducir un todoterreno en ese municipio es peligroso.
-No debe extrañarte tampoco que, en un cierto intervalo de tiempo, oigas afirmaciones contradictorias. Por ejemplo, que “el producto X rebaja significativamente el colesterol”, para más adelante escuchar que “tomar el producto X incrementa el nivel de colesterol”, e, incluso, podrías oír que “el consumo del producto X no interfiere en el nivel de colesterol”.
-A mí, tío, eso me desconcierta. Porque, según deduzco, dependiendo de quién haya hecho el estudio, se obtienen resultados diferentes. Si la estadística tiene sus reglas, eso no debería ocurrir.
-Claro que tiene sus reglas, pero las muestras de las que se parte para su estudio pueden estar amañadas (no ser representativas, de escaso número de individuos, asumir un error inadecuado…). Y eso se suele hacer, a menudo, por intereses económicos, políticos y también por la búsqueda de notoriedad individual. Por eso es muy importante que las administraciones públicas dispongan de controles eficaces con los que poder contrastar lo que se vende como cierto, especialmente cuando tiene repercusión en la salud y en el bienestar de la ciudadanía.
-¿Cómo se puede determinar si algo cumple con lo que se dice que es? —pregunta Tania con curiosidad.
-La estadística inferencial dispone de herramientas para ello a través de los intervalos de confianza y de los contrastes de hipótesis. Cierto es que siempre existe la posibilidad de cometer el error de aceptar como cierta una afirmación falsa, y, al revés: tomar por falsa una que no lo sea. Pero esos errores se pueden acotar. Y, siempre, lo mejor es no conformarse con lo que deduzcamos de una sola muestra, por muy adecuada que nos parezca. Repetir varias veces el contraste es lo que garantiza mejor la conclusión final.
-¿Tú crees, tío, que la estadística es totalmente necesaria para planificar la economía de un país, para así distribuir más justamente la riqueza?
La pregunta pareció desconcertar al viejo profesor. Aunque sonrió, su rostro no pudo evitar reflejar cierta indignación contenida. Mirando fijamente a su sobrina, le dijo:
-Claro que es totalmente imprescindible para la planificación. Pero la distribución de los beneficios de la actividad económica, Tania, tiene una componente ideológica muy fuerte, que no se rige por fórmulas matemáticas. Si en un país no es posible que la mayoría de sus ciudadanos tengan un empleo apropiado y digno, entonces deben producirse transformaciones en la economía, que avancen en la consecución de ese deseado objetivo, y, aunque determinados grupos de poder presionen para intentar mantener su status, el Estado debería velar por proteger la economía de los excesos y de los abusos y procurarles el bienestar a sus ciudadanos.
-Vaya, yo creía —dijo Tania— que la economía era como el tiempo atmosférico, que ahora se puede predecir, con bastante certeza, con varios días de antelación, cuando apenas hace unos años eso era impensable. Todo gracias, según he leído en internet, a modelos matemáticos. Pues avanzando en la búsqueda de modelos matemáticos, cada vez más perfectos, pienso que se puede disponer de herramientas con las que seamos capaces de tener un conocimiento más preciso de todos los factores que intervienen en la economía, ¿no crees, tío?, y poder distribuir mejor la riqueza.
-Por supuesto. Muchos economistas se esforzarán por domesticar la economía, y creo que se lograrán grandes avances. Pero corresponde a la sociedad exigir, y casi siempre conquistar, las mejoras sociales. ¡No lo olvides!
-Gracias, tío. Creo que me va a gustar la estadística. ¿Te parece que lo dejemos aquí y el próximo día entremos de lleno en materia?
-Desde luego, ya tengo la boca seca y, además, estoy viendo unos rosales que me parece que están tan secos como yo. Vamos a refrescarlos a ellos y a refrescarnos nosotros.