Aller au contenu

Un algorithme pour juger de la qualité d'un livre

Un algorithme pour juger de la qualité d'un livre
Un algorithme de nature à donner des sueurs froides aux éditeurs.

La maison d'édition française Short Édition est en train de développer une équation capable d'évaluer les propriétés littéraires des ouvrages qui lui sont soumis.

Voilà une invention de nature à donner des sueurs froides aux critiques littéraires et éditeurs de tout crin. La maison d'édition Short Édition a annoncé au site Actualité entamer l'élaboration d'une équation capable de jauger en quelques secondes la qualité littéraire d'un ouvrage qui lui serait soumis.

Selon Quentin Pleplé, le cofondateur de la maison d'édition interrogé par Actualité, sa société collabore en ce moment même avec des organismes spécialisés, comme le Liris (Laboratoire d'informatique en image et systèmes d'information) afin d'élaborer une formule mathématique complexe mêlant Data Mining («exploration de données») et Big Data (littéralement, «grosses données»).

Le procédé derrière ces calculs savants s'explique facilement. L'intelligence artificielle de la machine se développera dans un premier temps à partir d'un panel de 25.000 œuvres publiées par Short, des ouvrages déjà évalués par un minimum de cinq lecteurs humains au préalable. À partir des résultats des premiers tests, la maison d'édition «commencera à faire apprendre la machine: l'intelligence artificielle va traiter les données et établir des liens entre la qualité et les exigences».

L'ordinateur devrait, par la suite, être capable d'évaluer un livre de lui-même sur la base de multiples critères. L'algorithme pourra scruter, en vrac, les fautes d'orthographe et de ponctuation, la récurrence de motifs sémantiques (répétitions), le champ lexical (vocabulaire utilisé, registre de langue) et la longueur des phrases et des paragraphes. Chose plus complexe, il pourra jauger le style de l'auteur, qualifié selon le nombre d'adverbes, d'adjectifs, de pronoms, de verbes, de noms utilisés et la lisibilité du texte, défini relativement à un échantillon allant de l'ouvrage de jeunesse au traité d'économie.

Et cette découverte pourrait ne pas s'arrêter là. Le fondateur de Short Édition imagine déjà vendre sa petite merveille technologique à d'autres acteurs du monde du livre, des médias aux bibliothèques. «Elle pourra par exemple servir pour les bibliothèques, dans la classification d'ouvrages numérisés, mais également pour la presse. Dans l'édition, elle pourra apporter un premier éclairage sur les ouvrages reçus», assure ainsi Quentin Pleplé.

Une aide plus qu'une menace pour les éditeurs

Une telle nouveauté soulève immédiatement de nombreuses questions d'ordre moral. Remplacer l'homme par la machine ne va-t-il pas conduire inévitablement à une uniformisation du paysage littéraire? Quid de la spécificité d'un auteur - pensons à Louis-Ferdinand Céline par exemple, dont les qualités ne sont en aucun cas réductibles à la somme de tous ces critères stylistiques?

Ces doutes, légitimes, la maison d'édition tient à les apaiser. Que les Cassandre qui verraient déjà dans cette invention la fin d'un monde se rassurent: «Il ne s'agit pas de remplacer notre comité éditorial par une machine mais plutôt que cette dernière serve de filtre-assistant, dans une détection, moins de la qualité littéraire que de l'absence de qualités.» En clair, la machine servira simplement à établir une présélection de nature à économiser un temps précieux aux éditeurs, qui pourront alors faire leur travail, irremplaçable, de manière plus efficace. Les mathématiques main dans la main avec la littérature, la technologie à l'aide de l'humain, et pas le contraire.

 
 
Sur le même sujet
Aucun article
Le Figaro Premium

Abonnez-vous pour 1€ seulement

Annulable à tout moment

Réagir à cet article

23 commentaires
  • LES EDITIONS CHUM

    Cet article a du être écrit un 1er avril.
    Je suis éditeur et il suffit de quelques pages pour savoir à quoi on a affaire et de quelques chapitres pour savoir si ça vaut le coup d'aller au bout.
    Il est bon qu'il y ait une totale subjectivité quant au choix.

  • Quentin Pleplé

    Merci Claire pour l'article

    Je suis le responsable du projet Qualité Littéraire à Short Edition et suis à disposition pour répondre aux questions ou en discuter à quentin@short-edition.com

  • letellierpatrick

    En premier, sur l'article du résistant tué. Comme Jean Moulin le fut. Parce qu'il était communiste. Comme le furent le père et l'oncle de Boris Vian. Boris Vian aussi, pour sa chanson le déserteur, ce qui est moins connu. Pour les mêmes raisons non admises des américains et des services secrets mondiaux qu'ils chapeautent. A ce sujet lire le Ciel en enfer, qui sera primé en septembre par Bernard Pivot. Voir sur le site monbestseller point com, le même auteur, dans l'onglet actualité Le Blatnoï qui est lui aussi primé et en voix de faire un gros succès de rentrée. Les interviews seront publiées en septembre dans le nouvel Obs.

  • FG000

    El poura scruté l'es fot d'ortograf et les re pétition les répétition, les raies pétition les fils de pu...Etc tout langage usuel à l'homme de la rue...

  • Stan de Bordeaux

    Anna Gavalda, Marc Lévi et Guillaume Musso, ont des soucis à se faire.

  • tsarkolit

    Un algorithme choisissant "au hasard" entre "bon livre" et "mauvais livre" sera aussi efficace.

  • Eironos

    N'importe quoi.

  • SERGE TRESGUERRES

    Sommité de lecture?

  • SERGE TRESGUERRES

    Algotest pour tout livre mort.

  • Alex Andre 1

    Ernest Hemingway - Prix Nobel de Littérature - aurait échoué au test, lui qui si justement se jouait des répétitions et écrivait à grand renfort de verbes dit "pauvres". Une "aide" pour les éditeurs, peut-être, dépendamment de ce qu'ils recherchent. Un buzz et de la publicité gratuite pour cette "maison d'édition" inconnue: sûrement.

  • Jean Didier

    Un livre est d'abord un produit commercial : sa "qualité" pour un éditeur (et pour l'auteur) est donc le nombre d'exemplaires qu'il pourra vendre.
    Cela dépend non seulement de son contenu et de son thème, mais aussi de la conjoncture politique, économique, sociale et culturelle, des investissements faits en marketing, et d'autres critères très divers sans aucun rapport avec la valeur intrinsèque du livre.
    Pour la valeur littéraire proprement dite, il faudrait pour ça qu'il existe des critères connus et stables, et ce n'est pas le cas.
    Non seulement cette machine ne sert à rien, mais elle risque d'éliminer des œuvres de grande valeur, sans qu'aucun humain n'ait seulement la possibilité de l'avoir entre les mains.
    On ne dit jamais assez que l'intelligence artificielle est très proche de la bêtise naturelle, et cette maison d'édition en fait une éclatante démonstration.
    Cela dit, cette annonce est surtout un coup de pub pour un éditeur que personne ou presque ne connait. Sans ça, le Figaro n'aurait jamais parlé de lui !

  • Lucie Marc

    Short Editions:
    CA 2012: 53 600€
    effectif moyen: 2 personnes
    résultat net: -123 000 €. (source: société.com)
    A mon humble avis, ils n'ont ni le temps de lire des livres, ni les moyens de leurs ambitions.
    Un coup de com' avant une levée de fonds?

  • quoi-que

    bientôt les écrivains écriront pour les ordinateurs...

  • Taipan

    Un logiciel est parfaitement capable de détecter la richesse du vocabulaire mais pas la pertinence de son utilisation. Cela suffit pour un premier tri.
    La clarté de la pensée peut également se traduire pas des phrases courtes mais cela ne traduit pas la cohérence du plan.
    La fantaisie de l'ouvrage est bien sur indétectable par un logiciel.

  • sam amaritain

    Ah ces scientifiques!

  • bmatteucci@laposte.net

    Très drôle... c'est quoi la qualité littéraire d'un livre ? Peut-on utiliser les mêmes critères pour comparer Proust (phrases trop longues, adverbes multiples, trop de vocabulaire, idées qui s'entrecroisent au risque de perdre le lecteur...) et Marguerite Duras, forcément (phrases trop courtes, vocabulaire à développer, idées simples...). Est-on sûr que l'ordinateur doit remplacer l'humain pour tout ??? (entre parenthèse, j'ai indiqué ce que l'ordinateur dira en "lisant" les chefs d'oeuvre de ces écrivains). On se revoir le 1er avril pour ressortir cet article.

  • Jappy

    Une lacune... Et pas des moindres. On lit un livre avec des sentiments, du vécu, la connaissance de certaines situations, son âge, son sexe, son goût, ses préférences de lecture. Bref, toute chose qu'une machine si sophistiquer soit-elle, ne peut pas. Si c'était le cas, on connaîtrait les méandres du cerveau, l'intelligence artificielle n'est qu'un simulacre de situation, rien d'autre. Faisons confiance aux imperfections des auteurs fussent-ils des conteurs du réel ou de science-fiction qui nous entraînent dans leurs univers.

  • génius

    et un autre pour la qualité de ses dirigeants?

  • mathieubro

    Cela me parait bien une uniformisation du catalogue littéraire de la maison d'édition: en effet, l'IA va intervenir avant le comité de lecture, et non pas après (si j'ai bien compris).
    En procédant dans ce sens, inévitablement les ouvrages "pré-sectionnés" par l'IA pour le comité le seront tous sur les mêmes critères...

    La différence se fera donc entre maison d'édition, mais plus en interne.

    Et après tout, pourquoi pas, les producteurs de films sont bien souvent cantonnés à leur genre de prédilection, alors pourquoi pas la littérature?

  • Kaisa Sonninen

    Une maison d'édition qui veut faire juste parler d'elle. Si les critères d'un bon livre se résumaient à des variables mathématiques, cela fait longtemps que l'on ne vendrait plus que des best-sellers...