Citas, bibliografía y notas al pie: en qué consisten “las coincidencias” detectadas en la tesis de Sánchez

La tesis doctoral del presidente del Gobierno, Pedro Sánchez, ha despertado una batalla de porcentajes para determinar cuál es la cantidad exacta de contenido coincidente en su trabajo. Se habla del 13%, del 16% e incluso 17%, pero este nivel depende de los parámetros que se utilicen en el análisis de los datos que ofrece el primer chequeo. Un primer examen que no ofrece nada más que eso: porcentajes.

Después de las acusaciones de plagio que Sánchez ha recibido por parte del diario ABC, el presidente ha decidido hacer pública la tesis que le convirtió en doctor en Economía. Desde este viernes, el texto puede consultarse online en la plataforma TESEO, la base de datos en la que se recogen todas las tesis publicadas y remitidas al Ministerio de Educación. Una vez descargado el documento, puede analizase cuáles han sido las fuentes y las referencias que utilizó un por entonces desconocido para el gran público Pedro Sánchez.

Cuando en un primer momento eldiario.es introduce el documento firmado por el ahora presidente del Gobierno en el sistema, el programa antiplagio iThenticate, el sistema destinado al colectivo editorial y corporativo de Turnitin, una de las plataformas que utilizan las principales universidades españolas, los resultados apuntan a un 30% total de coincidencia en sus 342 páginas.

¿Por qué identifica un 30% cuando desde Moncloa y desde algunos medios de comunicación se habla de entre un diez y un veinte por ciento? La respuesta es simple: el sistema está diseñado para detectar coincidencias, independientemente de su origen, de su fecha y de su autoría. Así, por ejemplo, aparecen como referenciados los documentos publicados a posteriori y basados en la tesis; los artículos publicados en medios de comunicación, webs y blogs con partes de su contenido; las citas biliográficas a pie de página que han utilizado otros trabajos; o el apartado de bibliografía.

Es por esta razón por la que el “contenido coincidente” marcado en una primera vuelta, puede variar significativamente en una segunda. De hecho, desde Turnitin, el gerente territorial de la empresa en España, Lluís Val, remarca que estos datos deben ser analizados y estudiados en profundidad: “Tratar de subjetivizar cualquier escenario de plagio a un criterio numérico es un error. Hay que mirar los datos, analizarlos, y estudiar el trabajo con mucha atención”.

Uno de los primeros textos que aparecen como referenciados es el propio nombre de la tesis: Innovaciones de la diplomacia económica española: análisis del sector público (2000 - 2012). Cuando comprobamos de dónde vienen esas referencias, vemos que aparecen artículos de prensa en los que se cita el nombre o la página de Wikipedia de Pedro Sánchez, en la que hay una referencia sobre este trabajo.

Descartando las citas en medios de comunicación, las referencias a artículos publicados después de la presentación de la tesis, en el año 2012, y excluyendo el apartado de bibliografía, el análisis de eldiario.es apunta a un 16% de coincidencia. Un porcentaje en el que se incluyen las citas contenidas dentro del propio texto, palabras sueltas o construcciones gramaticales habituales que no pueden filtrarse en el sistema y citas de bibliografía o artículos de leyes a pie de página.

A pesar de todos los análisis y comprobaciones, catedráticos consultados por este periódico aseguran que no se puede medir el valor o la calidad de uno de estos trabajos a partir de un porcentaje de coincidencia. Desde la Universidad Complutense de Madrid y la Universidad Autónoma apuntan que debe ser el profesor el que evalúe esos resultados y decida si son o no aceptables “basándose en su experiencia profesional y en su trabajo diario con el alumno”.

Uno de los elementos que debe descartase es el apartado bibliográfico del trabajo. Cuando Sánchez o cualquier otro alumno indica cuáles son los trabajos ya publicados que han utilizado para documentarse o para incluir citas en el texto, lo hacen utilizando uno de los múltiples sistemas que se repiten en prácticamente todos los trabajos. Por tanto, esas páginas (que en un primer análisis aparecen subrayadas porque ya aparecen citadas en otros trabajos anteriores o porque vienen citados en textos que ha utilizado el autor para su trabajo) quedarían excluidas del porcentaje.

Las frases hechas, los nombres de los ministerios o las denominaciones de las leyes también aparecen subrayadas en el análisis de Turnitin. Muchas de estas referencias se incluyen en párrafos entrecomillados dentro del texto -que sí deben mantenerse dentro del análisis de coincidencias-, pero no podemos considerar que su uso sea un muestra de plagio. 

En la imagen que sigue a este párrafo podemos ver cómo el sistema detecta una coincidencias en la frase “los Estados miembros de la Unión Europea”. iThenticate nos subraya esta frase porque en el año 2005 el diario El Mundo utilizó esa misma expresión en un artículo sobre las leyes de extranjería.

Todos estos avisos aparecen destacados porque Turnitin no es un sistema de identificación de plagios. Es un cazador de coincidencias que compara secuencias de textos con todo lo que se ha publicado en la red, con las publicaciones que funcionan a través de un sistema de suscripción y con una amplia base de datos de trabajos que ya han sido analizados por el programa. Este último análisis es, según los responsables de la empresa, “el más eficaz” porque consigue crear “una descomunal base de datos de trabajos y conformar un sistema de seguridad intrauniversitario”.

Además de todas estas pequeñas referencias, también debe descartarse del análisis cualquier tipo de coincidencia con textos que se hayan publicado después de la presentación del trabajo que se estudia. En este caso, debe descartarse todo lo publicado a partir del año 2013 dado que la tesis se presentó el año anterior. Este vuelve a ser el caso del título de la tesis, que aparece referenciado en artículos de Vozpópuli o El Mundo.

Como se ha apuntado antes, uno de los elementos que forman parte del 16% de coincidencia y que debemos tener en cuenta son las citas y las referencias a otros autores dentro del texto. Los entrecomillados y las paráfrasis son una parte fundamental del trabajo de los alumnos en este tipo de trabajos, por lo que el corpus teórico debe incluirlas, siempre bien identificadas y referenciadas.

Las notas bibliográficas a pie de página también aparecen referenciadas, pero en este caso no se pueden excluir, cosa que sí podíamos hacer con el apartado de bibliografía. El sistema no permite dejar de lado todo este apartado, que se caracteriza por lo mismo que la bibliografía, por lo que tendrá que formar parte del 16% referenciado. La decisión de si este elemento debe introducirse en el resultado final de “contenido coincidente” deben tomarla los docentes encargados de supervisar el trabajo de sus doctorandos.