jueves, 26 de marzo de 2015

Ciencia para predecir si un libro será o no bestseller

¿Puede la tecnología determinar si un libro va a ser un éxito de ventas o se va a quedar en un fiasco comercial?


Bonita esperanza, creer que se pueda predecir si un libro sea o no bestseller desde los algoritmos matemáticos:especulación inútil./libropatas.com
Sorprendentemente (o quizás no tanto, el avance del análisis de datos ha conseguido ya cosas increíbles), científicos estadounidenses han desarrollado un algoritmo que permite analizar el contenido de un libro y determinar, con un ochenta y cuatro por ciento de posibilidades de acierto, si va a ser o no un bestseller. 
La profesora asistente del departamento de computación de la Universidad de Stony Brook (Nueva York) Yejin Choi y su equipo son quienes están detrás del algoritmo. Choi ha publicado sus conclusiones en el estudio Success with Style: Using Writing Style to Predict the Success of Novels, que acaba de ser presentado en la Empirical Methods in Natural Language Processing (una publicación – conferencia centrada en el análisis del lenguaje natural).
Stony Brook - equipo análisis de best sellers

"Examinamos la conexión cuantitativa entre el estilo de escritura y la literatura de éxito", explica Yejin Choi en la web de la universidad. "Basándonos en novelas de diferentes géneros, investigamos el poder preditivo de la estilometría para diferenciar trabajos literarios de éxito e identificamos los elementos estilísticos que son más abundantes en los escritos de éxito".
La estilometría, por cierto, no es un ciencia nueva, aunque las nuevas tecnologías han ayudado (y mucho) a conseguir resultados más afinados y más exactos. Es la base, por ejemplo, del análisis que permitió descubrir que J. K. Rowling era la autora de El canto del cuco.
Los investigadores consiguieron llegar a varias conclusiones altamente interesantes sobre los libros que ya han sido bestsellers. Así, los libros de éxito emplean más conjunciones (y, o, pero) para unir frases y también usan habitualmente preposiciones, sustantivos o pronombres. Los libros que no han conseguido el éxito abusan de los verbos, los adverbios y los extranjerismos. Y, por cierto, aunque mucha literatura de éxito nos parece a veces excesivamente tópica, los tópicos están en los libros que no han triunfado. Según las conclusiones del equipo de la profesora Choi, los libros no exitosos apuestan por palabras llenas clichés como amor, lugares comunes y palabras extremas o negativas.
Los resultados de la investigación, que contó con el apoyo financiero de una donación de Google, se pueden no solo aplicar a los libros sino también a las películas. En el cine, consiguen una tasa del ochenta y nueve por ciento de aciertos.