Un equipo de físicos suecos ha descubierto una fórmula para detectar una "huella" literaria que permita distinguir los textos de los escritores. La técnica, cuyos detalles se publican esta semana en el New Journal of Physics, se basa en el análisis estadístico de las palabras nuevas que van introduciendo los autores en sus obras.
Un grupo de investigadores del Departamento de Física de la Universidad de Umeå (Suecia) ha analizado las obras de Thomas Hardy (autor de Jude el oscuro), D. H. Lawrence (El amante de Lady Chatterley) y Herman Melville (Moby-Dick) para desarrollar una formula estadística que permite encontrar las huellas literarias que los distinguen.
Los científicos publican hoy en el New Journal of Physics un estudio en el que introducen un nuevo concepto denominado “meta-libro”, en el que usan la frecuencia con la que los escritores emplean palabras nuevas en sus obras para encontrar patrones diferenciadores en sus estilos de escritura.
Hasta ahora, y desde hace más de 75 años, se tomaban como referencia los postulados del filólogo estadounidesnse George Kingsley Zipf que, en base al análisis de una compilación de textos en inglés americano denominada Brown Corpus, sugirió la existencia de un patrón universal en la frecuencia con que los autores usan palabras nuevas. La ley de Zipf señala que el ranking de frecuencia de una palabra es inversamente proporcional a su aparición, es decir, que un pequeño número de palabras se utilizan mucho, mientras que un gran número apenas se emplean.
Pero las nuevas investigaciones sugieren que la frecuencia de las palabras es menos universal que lo que indica Zipf, y que tiene más que ver con la habilidad lingüística del autor que con cualquier otra regla del lenguaje.
Los físicos suecos encontraron que la aparición de nuevas palabras en los textos de Hardy, Lawrence y Melville decrecía a medida que sus libros eran más largos, y a pesar de que describieran nuevos escenarios o hubiera giros en el argumento. Además descubrieron que la disminución de la tasa de palabras únicas variaba entre los diferentes autores, y lo que era más significativo, esto sucedía en las obras completas de cualquiera de los tres.
El análisis estadístico se aplicó tanto a las novelas enteras como sólo a partes, así como a trabajos completos o recopilaciones de varias obras realizadas por estos autores, y en todos los casos aparecía una huella única con las frecuencias de las palabras.
El meta-libro, el gran libro madre
A partir de las evidencias que mostraron los modelos estadísticos los investigadores han introducido la idea del meta-libro, un código para cada autor que podría representar toda su obra, completa o que tuviera en mente.
Los científicos concluyen que este descubrimiento “nos dirige hacia un concepto de meta-libro en el que la escritura de un texto puede considerarse como un proceso donde el autor extrae un fragmento de texto de un gran libro madre (el meta-libro) y lo pone en el papel. Este meta-libro sería un infinito libro imaginario que representaría las frecuencias de las palabras de todo lo que un determinado escritor podría pensar jamás en escribir.