La portada de mañana
Acceder
Sánchez rearma la mayoría de Gobierno el día que Feijóo pide una moción de censura
Miguel esprinta para reabrir su inmobiliaria en Catarroja, Nacho cierra su panadería
Opinión - Cada día un Vietnam. Por Esther Palomera

De Dickens a Stephen King: así analiza el 'big data' lo mejor de la literatura

Por mucho que estudie, el mejor alumno tiene sus limitaciones a la hora de analizar los grandes textos de la literatura universal. Y no por su condición de estudiante, precisamente: los más versados profesores tampoco llegarán mucho más lejos. Al menos, no tan lejos como podría ir un software capaz de analizar miles de millones de las mejores líneassoftware de todos los tiempos.

Al menos así lo cree el escritor y experto en estadística Ben Blatt, que en su último libro trata de desentrañar los secretos de algunos de los grandes clásicos literarios aprovechando las virtudes del big data. Al concentrarnos en una sola frase de un autor o en un pasaje en particular de una novela, como hacemos al analizar las obras desde el tradicional prisma académico, “se pierde una visión más amplia que muestra esos patrones y tendencias que los escritores utilizan una y otra vez”, explica Blatt.

Por eso decidió cambiar de enfoque. Al otorgar a cada palabra la misma relevancia, el libro se convierte en un compendio de decenas de miles de puntos de información útiles que merecen ser analizados.

“Construí una base de datos de miles de libros de cientos de grandes autores y traté de responder a las preguntas que los escritores y los lectores se han hecho alguna vez”, explica Blatt a HojaDeRouter.com. “Los escritores han debatido sobre los signos de exclamación y su eficacia en la escritura, pero ¿qué muestran los números? Los lectores se han quejado de que la escritura hoy sigue simplemente una fórmula, pero ¿es verdad?”, se pregunta.

A la hora de elegir los títulos con los que construiría su base de datos, Blatt acudió a la lista de los más vendidos y a los autores más relevantes de la historia. Así, entre los libros analizados hay un poco de todo: desde verdaderos clásicos de la literatura escritos por Jane Austen o Charles Dickens hasta superventas firmados por Danielle Steel, Stephen King o J. K. Rowling.

De esa amalgama de datos, Blatt extrajo, por ejemplo, que las frases de apertura de las novelas suelen ser cortas, que Jane Austen recurre a 115 clichés por cada 100.000 palabras y que Nabokov escribió el término “malva” 44 veces más que el promedio de los escritores de los últimos doscientos años, algo que tiene cierto sentido, pues el autor de Lolita tenía sinestesia y en su autobiografía explica cómo, al escuchar diferentes letras o sonidos, su cerebro evocaba automáticamente un color. Y es precisamente este anecdótico dato el que da título al libro en el que Blatt recoge las conclusiones de su investigación: ‘Nabokov's Favorite Word Is Mauve’ (“La palabra favorita de Nabokov es malva”).

Python como compañero de viaje

“En total, eran miles de millones y miles de millones de palabras analizadas”, asegura Blatt. Para manejar tamaña cantidad de datos literarios, el autor recurrió a un conjunto de herramientas de código abierto llamado Natural Language Toolkit. “Ayuda a coger un archivo de texto y analizar las palabras, partes del discurso, oraciones, etcétera”, explica Blatt, quien, con un leve conocimiento de Python, programó su singular base de datos para hallar ciertos patrones en todas estas obras que hasta ahora no habían sido descubiertos.

De esa base de datos extrajo conclusiones de todo tipo: tanto algunas que, en sus propias palabras, “son mucho más simples y tontas” como otras que pueden resultar bastante útiles a la hora de analizar el estilo de un autor e incluso para tratar de seguir sus pasos.

Es el caso de lo que Blatt aborda en el primer capítulo de su libro: el uso de los adverbios acabados en “-mente” (en “-ly”, en inglés). Mientras muchos autores (Stephen King, sin ir más lejos, en su manual de escritura ‘On Writing’) desaconsejan su uso, Blatt se preguntaba si las principales obras de los más célebres autores, King incluido, hacían caso a este consejo. “Hay una tendencia en autores como Hemingway: sus mejores libros son los que tienen una menor cantidad de adverbios acabados en ‘-ly’”, explica el estadista.

Sin embargo, los datos no son tajantes al respecto: mientras el americano que popularizó las fiestas de San Fermín en todo el mundo usó un total de 80 de estos adverbios en sus 10 novelas, J. K. Rowling recurrió a 140 en las 7 entregas de la saga de Harry Potter y el propio King utilizó más de 100 en 50 de sus obras, algo que no les ha impedido alcanzar al éxito, como le ocurrió a Dickens, con más de 100 de estos adverbios en 20 novelas, o Jane Austen, que se atrevió a utilizar cerca de 130 en tan solo media docena de libros.

En cuanto al primer tipo de descubrimientos a base de big data, los más curiosos o anecdóticos, Blatt analizó el tamaño del nombre de los autores en la portada de los libros para descubrir cómo crece la tipografía desmesuradamente cuando pasa a ser un superventas según la popular lista de The New York Times.

Por analizar, analizó hasta el uso de exclamaciones. En este sentido, los datos desmontaron el consejo de un autor de best sellers, Elmore Leonard, que recomendaba allá por 2001 (en un artículo publicado, precisamente, en The New York Times) no utilizar signos de exclamación. “El argumento es que las descripciones en sí deben ser emocionantes y no depender de los signos de puntuación”, recuerda Blatt. Sin embargo, ni él mismo ha logrado deshacerse de ese compañero de viaje: aun después de publicar aquel artículo, Leonard siguió recurriendo a 10 signos de exclamación por cada 100.000 palabras (lejos de los casi 60 que utilizaba antes, pero sin lograr desembarazarse de ellos).

Otra incoherencia cazada por Blatt tiene que ver con la primera frase de las novelas. Mientras muchos autores recomiendan no empezar hablando del tiempo, no son pocos los novelistas que han apostado por arrancar sus obras con esta temática tan propia de una conversación de ascensor y, al parecer, no les ha ido mal. Según Blatt, Danielle Steel recurre a este inicio en cerca de la mitad de sus más de 90 novelas. No obstante, no solo de best sellers pasionales viven las conversaciones meteorológicas: Dickens acudió a tan manido tema en un 10% de sus obras, mientras que Twain o Agatha Christie lo hicieron en un 8% y un 5%, respectivamente. 

¿La fórmula del éxito?

Si Blatt ha descifrado los secretos de los clásicos de la literatura gracias a su análisis de miles de millones de palabras, cabe pensar que el big data puede convertirse en un valioso colaborador del novelista a la hora de buscar los ingredientes del éxito. ¿Estará la receta para cocinar superventas en los datos?

Todas las novelas, te guste o no, tienen una estructura similar. Se escriben en capítulos que tienen párrafos que tienen frases. Hay una acción ascendente, un clímax y una resolución”, resume Blatt. Sin embargo, desmiente cualquier posibilidad de hallar una ecuación que garantice ventas millonarias. “No hay fórmula mágica que haga un libro un éxito”, sentencia.

Esto no quiere decir que no haya algunas pistas que seguir para emular a los maestros de las letras. “Hay algunas cosas que parecen tener todos”, explica el periodista. “Generalmente, una escritura directa (como el uso de pocos adverbios) es muy popular y los libros que no son demasiado largos funcionan bien”, analiza.

“Para los libros que forman la lista de ‘best sellers’ de 'The New York Times', es importante que los capítulos terminen en un poderoso cliffhangercliffhanger”, desmenuza, recomendando así cortar la trama en medio de una escena emocionante, sin desvelar el final, para así llevar al lector de la mano hasta el siguiente capítulo.

“Esto no son mandatos”, concluye Blatt, “pero resulta que muchos escritores exitosos han descubierto los mismos trucos”.

----------------

Las imágenes de este artículo son propiedad, por orden de aparición, de Wikimedia Commons (y 2), 'Sentido y sensibilidad' y Pixabay