Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.

Los algoritmos señoros

Los algoritmos definen la información que alcanza a cada usuario o usuaria.

Miren Gutiérrez

13

Danica Savonick y Cathy N. Davidson recientemente publicaban una lista de 37 estudios sobre prejuicios de género en la investigación. En algunos de estos estudios, revisores que creen que están emitiendo juicios “objetivos” basados en criterios de “calidad”, “excelencia” o “experiencia” cambian su valoración radical y consistentemente dependiendo si el evaluado es un hombre o una mujer. Es decir, el mismo trabajo realizado por personas que se supone que son hombres se considera sistemáticamente superior al del trabajo de las personas que se supone que son mujeres.

Un estudio que apareció en las actas de la Academia Nacional de Ciencias de los Estados Unidos reconoce que los prejuicios de género provienen “de la exposición repetida a los estereotipos culturales que muestran a las mujeres como menos competentes ”. Las mujeres tienen menos opciones para recibir premios académicos (y de cualquier otro tipo), para ser promovidas (solo hay siete rectoras de universidad en España cuando somos mayoría en la universidad), y para que se las cite. La discriminación de género aparece en todos estos estudios incluso si las formas, los métodos y las métricas varían.

Todo esto es el material (los datos) del que se nutren los algoritmos detrás de los ránkings de investigación que luego servirán para promoverte, darte financiación para un proyecto o acreditarte como investigadora.

Precisamente, estaba preparando una evaluación de mi trabajo científico, cuando me doy cuenta de que las dos webs más importantes de citas académicas, la Web of Science (WoS) y Scopus, además de Google Scholar, estaban atribuyendo muchas de mis obras a otras personas (hombres, cómo no).

Los algoritmos de machine learning funcionan así: cuantos más datos engullen, más “perfeccionan” la función automática para la que han sido diseñados. El problema empieza cuando los datos están sesgados, siguiendo el viejo adagio “basura entra, basura sale” (garbage in, garbage out).

El caso es que un libro mío, y todos sus capítulos (que habían sido publicados de forma independiente), se atribuía a al autor de su prólogo en Scopus y la WoS, que se anuncia como “el mayor índice de citas independiente de la editorial y plataforma sobre la investigación”. Y el algoritmo de Google Scholar adjudicaba casi toda mi obra a un investigador con mi mismo apellido e inicial. Es decir, ante la duda (dado que muchas veces las obras son referenciadas solo con el apellido y la inicial del nombre), el algoritmo decidió que adjudicando mis obras a un hombre con el mismo apellido e inicial era más probable acertar.

Hubo que escribir (varias veces) a Scopus y WoS, que investigaron y corrigieron el problema. Pero Google no tiene las mismas salvaguardas. “No tenemos forma de saber qué artículos son realmente suyos –advierte Google Scholar Citations—. Los nombres de los autores (y autoras) a menudo se abrevian y diferentes personas a veces comparten nombres similares. Utilizamos un modelo estadístico para tratar de distinguir a diferentes autores (y autoras), pero estos procesos automáticos no siempre son precisos. La mejor manera de solucionar esto es revisar los artículos en su perfil y eliminar los que fueron escritos por otros (u otras)”. La traducción es de Google Translate; los paréntesis, míos.

Después de pedirle (insistentemente) que “limpiara” su perfil, el investigador al que se le adjudicaba mi obra pasó de decenas de miles de citas a unas 5,000. Quién sabe cuántos artículos y citas de mujeres le asignó erróneamente el modelo estadístico de Google.

Hay informes que demuestran que hay sesgos de género en los rankings académicos. Por ejemplo, un estudio de 47,000 investigadores e investigadoras y sus publicaciones en WoS entre 2008 y 2011 muestra que las mujeres están muy poco representadas en el grupo más productivos. En otro índice, el de Nature, otro estudio que tenía en cuenta 293,557 artículos descubre que solo el 29.8% de las autorías son de mujeres. Las mujeres son también mucho menos numerosas como revisoras de otras publicaciones, dice otro.

A la luz de estos estudios, el problema con mis citas no parece un hecho aislado.

Etiquetas
stats