Avez-vous déjà entendu parler de la Stylométrie ? Prenant ses sources chez les scribes de Galilée, la stylométrie est une méthode d’investigation révolutionnaire qui passe au crible les textes et leurs styles. De Jules César au corbeau de l’affaire Gregory, en passant par Elena Ferrante et Kurt Cobain, elle permet de clore certains débats et controverses de l’Histoire. Au travers de leur livre « Affaires de style, du cas Molière à l’affaire Grégory : la stylométrie mène l’enquête », publié le 7 avril 2022 aux éditions du Robert, Florian Cafiero et Jean-Baptiste Camps dévoilent la manière d’élucider certaines des plus grandes affaires non résolues et autres mystères de l’histoire.

Identifier qui se cache derrière un texte

Le livre se lit comme un recueil de romans policiers. Chaque chapitre est d’ailleurs présenté à la manière d’une enquête policière. Avec des pistes sérieuses ou farfelues, parfois confirmées, parfois abandonnées, mais toujours explorées. Les suspects sont plus ou moins recommandables, les mystères empruntés tantôt à l’histoire criminelle, tantôt aux grandes controverses de la littérature.

Qui se cache derrière le pseudonyme de l’auteur à succès Elena Ferrante ? Qui a réellement écrit l’Illiade et l’Odyssée ? Molière a-t-il tout volé à Corneille ? Shakespeare était-il un génie ? Qui sont les créateurs du mouvement QAnon ? Peut-on débusquer les différents auteurs de la Bible ? Voilà quelques-uns des dossiers ouverts par Florian Cafiero et Jean-Baptiste Camps. Le premier est normalien, ingénieur au CNRS, le second philosophe, docteur en études médiévales de la Sorbonne et maître de conférences à l’École des Chartes.

Les secrets d’une discipline méconnue : la stylométrie

La stylométrie s’applique à étudier le style linguistique et la langue écrite, mais elle a également été appliquée avec succès à la musique et aux Arts visuels, notamment la peinture. Par l’application d’une analyse statistique à l’ensemble des œuvres et des écrits d’un auteur ou d’un artiste, la stylométrie est souvent utilisée pour attribuer la paternité de documents anonymes ou contestés. Elle a des applications tant juridiques qu’universitaires et littéraires, allant de la question de la paternité des œuvres de Shakespeare à la linguistique judiciaire et, plus récemment, à la découverte des blogueurs derrière le mouvement conspirationniste et pro-Trump QAnon.

Développée à partir d’anciennes techniques d’analyse de textes, la stylométrie permet de trouver des preuves d’authenticité et des identités d’auteur. Les applications de la stylométrie sont multiples et comprennent les études littéraires, les études historiques, les études sociales, la recherche d’informations, etc. Appliquée également aux études médico-légales, au code informatique et à la détection du plagiat, la stylométrie peut également être utilisée pour prédire la langue maternelle d’une personne grâce à sa vitesse de frappe sur un clavier.

Études de cas historiques intéressants

Utilisée dès le XVe siècle, c’est grâce à la stylométrie que Lorenzo Valla a démontré en 1439 que la Donation de Constantin était un faux, en comparant l’analyse linguistique du latin avec celui utilisé dans le document authentique du IVe siècle.

En 1996, aux USA, l’analyse stylométrique du livre controversé Couleurs Primaires, écrit sous pseudonyme par un certain Donald Foster, a permis de démontrer, plusieurs mois après sa publication et après analyse de l’écriture manuscrite, que son véritable auteur était le chroniqueur Joe Klein.

La même année, des études stylométriques ont été utilisées pour comparer le manifeste d’Unabomber avec des lettres écrites par l’un des suspects, Theodore Kaczynski, ce qui permis l’arrestation puis la condamnation de ce dernier.

En avril 2015, des chercheurs utilisant des techniques de stylométrie ont identifié une pièce de théâtre, Double Falsehood, comme étant l’œuvre de William Shakespeare. Depuis 1727, date à laquelle la pièce avait été publiée par l’écrivain et dramaturge britannique Lewis Theobald, nul n’avait pu prouver avec exactitude si Shakespeare était ou non l’auteur de cette tragédie.

En 2017, un groupe de linguistes, d’informaticiens et d’universitaires a analysé via la stylométrie les œuvres de la romancière italienne Elena Ferrante. À partir d’un corpus créé à l’université de Padoue contenant 150 romans écrits par 40 auteurs, les chercheurs ont analysé le style de Ferrante en se basant sur sept de ses romans. Leurs conclusions furent unanimes : l’écrivain, scénariste et journaliste italien Domenico Starnone est l’auteur des romans d’Elena Ferrante.

En 2020, Rachel McCarthy et James O’Sullivan ont prouvé qu’Emily Brontë était bien la véritable autrice des Hauts de Hurlevent, mettant fin aux spéculations de certains critiques selon lesquelles le roman aurait pu être écrit par l’un de ses frères et sœurs.

Qui sont les apôtres de QAnon ?

En 2017, un message apparaît sur le forum controversé 8chan : « Open your eyes » (Ouvrez les yeux), suivi de l’affirmation trompeuse comme quoi « many in our govt worship Satan » (de nombreux membres de notre gouvernement adorent Satan). Les fidèles de QAnon attribuèrent rapidement ces messages à un initié militaire anonyme connu sous le nom de « Q ». Ce n’est qu’en 2022 et avec le concours de l’apprentissage automatique d’une IA couplé à l’étude linguistique de la stylométrie, que plusieurs équipes distinctes d’informaticiens identifièrent deux hommes comme étant les auteurs des messages ayant alimenté le mouvement viral QAnon.

L’une des équipes à l’origine de cette découverte est suisse, OrphAnalytics. Elle a utilisé un logiciel analysant des séquences de caractères, selon des méthodes employées pour l’analyse du génome. La seconde expertise a été confiée à une équipe française, formée par l’ingénieur de recherche au CNRS Florian Cafiero et Jean-Baptiste Camps, maître de conférences en philologie computationnelle à l’École des Chartes, qui utilisent l’intelligence articifielle pour l’analyse de textes anciens. C’est en comparant des modèles subtils dans leurs textes — qu’un lecteur occasionnel ne pourrait pas détecter — que les chercheurs ont pu démontrer que l’apôtre de Q était en réalité deux individus distincts : Paul Furber, un développeur de logiciel et journaliste sud-africain et Ronald Watkins, tous deux ex-administrateurs du site web 8chan.

De Chrétien de Troyes aux Alcooliques Anonymes, de Charlène Hummert à l’auteur du Roman de la Rose, l’analyse stylométrique n’épargne rien ni personne…

Affaires de style - la stylométrie mêne l'enquête
Affaires de style, du cas Molière à l’affaire Grégory : la stylométrie mène l’enquête

Florian CafieroJean-Baptiste Camps
Éditeur : Le Robert
ISBN : 978-2-321-01734-9
EAN : 9782321017349
Date de parution : 07/04/2022