Une maison d'édition teste un algorithme pour déterminer la qualité de ses livres

Trân Thi-Tiên Stagiaire

Stagiaire 22-07-2014, 12:53 Mise à jour le: 04-12-2020, 19:17

La machine pourra-t-elle un jour se substituer au jugement humain? Pour l’heure, Short Édition teste un outil capable, à l’aide d’un algorithme, de définir la qualité d’un texte, mais pas question encore de remplacer la lecture humaine.

Non, l’avenir de l’homme n’est pas scellé par les machines… Du moins, pas encore. Short Édition travaille actuellement sur l’élaboration d’un outil informatique, s’appuyant sur le « Machine Learning » qui mêle Data Mining et Big Data, afin de créer un algorithme qui puisse déterminer la qualité littéraire d’un texte. Ce projet, certes ambitieux, ne prétend pas pour autant substituer le jugement humain, mais pourra très probablement faire gagner du temps aux maisons d’édition en les aidant à mieux sélectionner leurs textes.

Concrètement, comment ça fonctionne? Ce sont près de 25.000 livres qui constituent la base de données de Short Édition. À partir de ces datas, la machine -ou l’intelligence artificielle- commence une première phase de sélection en établissant des connexions entre qualité et exigences déterminées préalablement par l’évaluation humaine. Pour cette première étape, l’ordinateur mesure différents critères considérés comme importants dans le jugement d’une oeuvre littéraire tels que les indicateurs sémantiques (répétitions, figures de style: anaphore, métaphore…), l’ampleur du champ lexical (langage argotique ou non, utilisation de mots rares), la longueur des phrases et des paragraphes, le style (quantité d’adverbes, d’adjectifs, de pronoms, de verbes, de noms…), les fautes d’orthographe et de ponctuation et enfin la lisibilité d’un texte (facilité d’accès variant d’un ouvrage jeunesse à des documents plus complexes et spécifiques). Ce filtrage doit ensuite être confirmé par un cerveau humain. Cette démarche constituerait donc un gain de temps considérable quand on sait qu’habituellement, chaque livre reçu doit d’abord être lu par cinq à dix personnes. Néanmoins, le cofondateur et responsable technique de Short Édition, Quentin Pleplé, interrogé par le site d’information spécialisé ActuaLitté, insiste bien sur le fait qu’« il ne s’agit pas de remplacer [le] Comité éditorial par une machine: plutôt que cette dernière serve de filtrage-assistant, dans une détection, moins de la qualité littéraire, que de l’absence de qualités. »

Bien analyser, même pour une machine, est une question d’apprentissage

Par ailleurs, Quentin Pleplé précise que le programme n’est pas encore capable de distinguer l’effet de style. Ainsi, l’écriture de Céline alliant brillamment langage littéraire et argotique, de même que les phrases interminables de Proust, pourraient très bien passer à côté de la sélection informatique. Le cofondateur de Short Édition, pour qui tout est question d’apprentissage, reste plutôt optimiste quant à l’idée de voir la machine affiner au fur et à mesure sa capacité de jugement: « Le ‘Machine Learning’ repose autant sur la capacité d’apprentissage de l’outil informatique que sur la finesse des critères qu’on lui impose. Nous devons former son analyse, vierge de tout critère, pour lui apporter un contenu, qui le fera progresser. » Ainsi, parlant de l’exemple d’une lettre de Marcel Pagnol, écrite dans un français d’enfant et (donc) bourrée de fautes, Pleplé explique que « l’ordinateur ne saura pas distinguer l’effet de style, au départ, alors il signalera un passage particulièrement mal écrit, sur l’ensemble du livre. Mais avec le temps, la machine saura reconnaître qu’il y a un changement spécifique, et pourquoi pas, l’analyser correctement.«

Si, concrètement Short Édition sera le premier à tester cette nouvelle technologie, Quentin Pleplé imagine déjà le Machine Learning servir d’autres domaines de l’édition comme la presse ou bien les bibliothèques qui, de plus en plus, concilient quantité conséquente de textes avec traitement numérique. Pourquoi dès lors ne pas compter sur un ordinateur pour opérer un premier tri? Si cette idée est de prime abord séduisante, ActuaLitté souligne le risque que l’ordinateur finisse par « lisser la sélection et uniformiser d’une certaine manière les choix éditoriaux ». C’est pourquoi, Quentin Pleplé insiste bien sur le fait que la machine « ne sera jamais celle qui décide: elle n’aura pour vocation que de filtrer, selon certains critères. » Même si au terme de l’analyse, l’ordinateur est amené à donner une note à l’oeuvre évaluée, Pleplé précise que le plus important in fine est le processus d’évaluation opéré par le programme et sa capacité à justifier la note. « Cette démonstration-là sera vraiment passionnante », conclut-il.