La stylométrie : quand les algorithmes mènent l’enquête – de Molière à nos affaires contemporaines

Longtemps réservée aux cercles de philologues et de linguistes, la stylométrie connaît depuis quelques années un regain d’intérêt inattendu. Cette discipline, qui applique les outils statistiques à l’analyse des textes, vise à identifier un auteur à partir de sa manière d’écrire : fréquence des mots-outils, tournures syntaxiques, rythme des phrases. Autrement dit, une empreinte stylistique aussi singulière qu’une signature manuscrite.

ACTUALITÉS

TLI

10/28/202512 min read

La stylométrie, quand les algorithmes mènent l’enquête : de Molière à nos affaires contemporaines

L’art de mesurer le style

Longtemps réservée aux cercles de philologues et de linguistes, la stylométrie connaît depuis quelques années un regain d’intérêt inattendu. Cette discipline, qui applique les outils statistiques à l’analyse des textes, vise à identifier un auteur à partir de sa manière d’écrire : fréquence des mots-outils, tournures syntaxiques, rythme des phrases. Autrement dit, une empreinte stylistique aussi singulière qu’une signature manuscrite.

Derrière cette science du style se cache une idée simple : nous écrivons sans le savoir selon des schémas récurrents, mesurables, comparables. Ce que la critique littéraire percevait autrefois comme un « ton » ou une « voix » devient aujourd’hui un profil mathématique, que les ordinateurs peuvent reconnaître avec une précision croissante.

Le cas Molière, ou l’algorithme contre la légende

Depuis plus d’un siècle, une rumeur obstinée plane sur la figure de Molière. Jean-Baptiste Poquelin aurait-il été un simple prête-nom pour Pierre Corneille ? Les sceptiques, de Pierre Louÿs à quelques universitaires isolés, ont entretenu le doute, s’appuyant sur l’absence de manuscrits autographes et sur la proximité entre les styles des deux dramaturges.

En 2019, deux chercheurs français, Florian Cafiero et Jean-Baptiste Camps, ont décidé d’en finir avec la querelle en soumettant les textes à la rigueur de la stylométrie. À partir de trente-sept pièces de Molière et d’un vaste corpus de contemporains, ils ont appliqué six méthodes d’analyse : mesure des mots-outils, structures grammaticales, successions syntaxiques. Le verdict fut net : les œuvres de Molière forment un ensemble cohérent, distinct de celui de Corneille.

Autrement dit, les vers du Tartuffe ou du Misanthrope portent bien la main de Molière. L’algorithme, ici, ne remplace pas le jugement esthétique ; il le prolonge. La machine ne dit pas ce qu’est le style, mais montre qu’il existe, singulier, mesurable, irréductible à une autre plume.

Une science entre littérature et tribunal

Si l’affaire Molière amuse les érudits, la stylométrie quitte désormais les bibliothèques pour entrer dans les prétoires. L’analyse des messages anonymes, des lettres de menace, des tweets ou des blogs suspects fait partie des nouveaux outils de la police scientifique.

Dans le sillage de la linguistique judiciaire, ces méthodes permettent de déceler des régularités d’écriture, d’établir des rapprochements entre un auteur connu et un texte anonyme. L’empreinte stylistique, au même titre qu’une empreinte digitale, devient indice. Ainsi, dans le sillage du débat sur la paternité des œuvres de Molière, la stylométrie a quitté les amphithéâtres et les revues académiques pour se retrouver, trois siècles plus tard, au cœur d’affaires criminelles. Ce glissement n’a rien d’anecdotique : il raconte la manière dont une science de la nuance et de la trace est devenue un instrument de vérité judiciaire.

Dans les années 2010, les mêmes chercheurs qui avaient tranché la querelle Molière-Corneille — Florian Cafiero et Jean-Baptiste Camps — ont vu leurs travaux cités bien au-delà du monde des lettres. Leur ouvrage Affaires de style (Seuil, 2023) retraçait cette étonnante migration : comment les algorithmes conçus pour départager deux dramaturges du Grand Siècle s’appliquent désormais à identifier un corbeau moderne, auteur de lettres anonymes dans des dossiers criminels.

L’affaire Grégory, tragédie française parmi les plus scrutées du XXᵉ siècle, en constitue l’exemple le plus saisissant. Depuis le 16 octobre 1984, date de la découverte du corps du petit Grégory Villemin dans les eaux de la Vologne, les enquêteurs se heurtent à une énigme : qui a écrit les dizaines de lettres de menace et d’insultes adressées à la famille ? Ces écrits, saturés de rancune et de ressentiment, ont longtemps défié les graphologues, les experts en linguistique, les juges.

Quarante ans plus tard, la stylométrie a rouvert une brèche. À la demande des magistrats, un laboratoire suisse spécialisé dans l’analyse statistique du langage a comparé les lettres anonymes à des écrits personnels de plusieurs protagonistes du dossier. En 2025, les résultats ont conduit à la mise en examen de Jacqueline Jacob, la grand-tante de l’enfant, sur la base de similitudes fortes entre ses tournures d’écriture et celles des lettres du « corbeau ». Les experts ont relevé des coïncidences répétées dans le choix des mots-outils, la ponctuation, le rythme des phrases, mais aussi dans des détails syntaxiques réputés impossibles à imiter consciemment.

Cette mise en examen est une avancée importante souligne l'avocate des parents de Grégory. "Une avancée pourquoi ? Un, parce que ça démontre que la justice n'abandonne pas. Et deux, parce que non seulement elle n'abandonne pas, mais elle montre qu'elle se donne tous les moyens pour continuer", félicite Me Marie-Christine Chastant-Morand.

L’affaire Ramadan : la stylométrie au cœur d’un double mensonge

Dans les dossiers suisse et français visant Tariq Ramadan, la stylométrie a fait surgir un tournant inattendu. Mandatée par la défense, la docteure en Linguistique judiciaire américaine Carole E. Chaski a analysé, à l’aide de sa méthode brevetée SynAID, plusieurs séries de message attribués à deux de ses accusatrices, l’une en Suisse, l’autre en France. Son expertise, fondée sur l’étude de milliers de structures syntaxiques, conclut que les messages litigieux ont été rédigés par les deux plaignantes elles-mêmes, avec un taux de fiabilité supérieur à 97 %.

"La stylometrie est une technique scientifique qui se base sur les espaces, la ponctuation, la synthaxe d'un texte, afin de l'approprier à un auteur donné, explique Me Pascal-Pierre Garbarini. Cette technique n’était pas aussi approfondie il y a sept ans. Aujourd’hui c’est différent. Elle est assistée par ordinateur. Nous avons sollicité des experts de renommée mondiale. Ils ont analysé les procédures, et leurs résultats permettent de certifier que l’accusatrice, qu’on appelle en France Christelle, avait préparé en amont un plan pour nuire à Tariq Ramadan. Cette expertise balaye d’un revers de main tout le récit de cette femme." exprime l'avocat de Tariq Ramadan à nos confrères de France Info.

L’expertise révèle ainsi que ces deux femmes avaient évoqué l’idée de "piéger” Tariq Ramadan avant toute rencontre : l’une lors de sa première prise de contact avec le prédicateur, l’autre six jours avant leur unique rendez-vous. Toutes deux ont nié être à l’origine de ces écrits même si elles avaient confirmé qu'il s'agissait de leur pseudonyme. La stylométrie, en identifiant l’auteur invisible derrière les mots, s’impose ainsi comme un acteur central d’une affaire où la preuve ne réside plus seulement dans les faits, mais dans la syntaxe. Sur la base stylométrique, ses avocats suisses ont déposé une demande de révision de son procès. Le prédicateur avait été condamné en appel à Genève en septembre 2024 à trois ans de prison dont un ferme. Sa condamnation est devenue définitive en août dernier. Et il a décidé de saisir la Cour européenne des Droits de l’homme (CEDH). La stylométrie vient donc confirmer la version première de la brigade criminelle qui n'avait pas été prise en compte en France dans ce dossier, nous confie un journaliste proche du dossier.

La vérité à l’épreuve des mots

De Molière à Grégory, de Grégory à Ramadan, la stylométrie trace un même sillon : celui d’une science du langage capable de révéler ce que les mots dissimulent. Dans la querelle littéraire, elle a restitué à l’auteur son œuvre ; dans le drame judiciaire, elle a redonné voix à l’écrit anonyme ; dans le procès contemporain, elle interroge la sincérité même des accusations.

Dans les lignes de Marianne, le chroniqueur Alain Bauer souligne que "Les progrès technologiques bouleversent les méthodes d’enquête criminelle. De la stylométrie à l’intelligence artificielle, en passant par les capteurs nanométriques, les outils de la police scientifique deviennent toujours plus précis et sophistiqués".

Cette empreinte, désormais mesurable, bouleverse notre rapport à la preuve. Elle rappelle que dans une époque saturée de discours et de traces numériques, l’écriture devient un témoin à part entière, parfois plus fiable que la mémoire ou le récit. En franchissant les frontières entre littérature, enquête et justice, la stylométrie ne se contente plus d’éclairer le passé : elle redéfinit la manière dont se construit la vérité. Et, qu’il s’agisse d’un dramaturge du Grand Siècle ou d’un accusé du XXIᵉ, elle pose toujours la même question : qui parle, et jusqu’où peut-on le prouver ?

La stylométrie, quand les algorithmes mènent l’enquête : de Molière à nos affaires contemporaines

L’art de mesurer le style

Longtemps réservée aux cercles de philologues et de linguistes, la stylométrie connaît depuis quelques années un regain d’intérêt inattendu. Cette discipline, qui applique les outils statistiques à l’analyse des textes, vise à identifier un auteur à partir de sa manière d’écrire : fréquence des mots-outils, tournures syntaxiques, rythme des phrases. Autrement dit, une empreinte stylistique aussi singulière qu’une signature manuscrite.

Derrière cette science du style se cache une idée simple : nous écrivons sans le savoir selon des schémas récurrents, mesurables, comparables. Ce que la critique littéraire percevait autrefois comme un « ton » ou une « voix » devient aujourd’hui un profil mathématique, que les ordinateurs peuvent reconnaître avec une précision croissante.

Le cas Molière, ou l’algorithme contre la légende

Depuis plus d’un siècle, une rumeur obstinée plane sur la figure de Molière. Jean-Baptiste Poquelin aurait-il été un simple prête-nom pour Pierre Corneille ? Les sceptiques, de Pierre Louÿs à quelques universitaires isolés, ont entretenu le doute, s’appuyant sur l’absence de manuscrits autographes et sur la proximité entre les styles des deux dramaturges.

En 2019, deux chercheurs français, Florian Cafiero et Jean-Baptiste Camps, ont décidé d’en finir avec la querelle en soumettant les textes à la rigueur de la stylométrie. À partir de trente-sept pièces de Molière et d’un vaste corpus de contemporains, ils ont appliqué six méthodes d’analyse : mesure des mots-outils, structures grammaticales, successions syntaxiques. Le verdict fut net : les œuvres de Molière forment un ensemble cohérent, distinct de celui de Corneille.

Autrement dit, les vers du Tartuffe ou du Misanthrope portent bien la main de Molière. L’algorithme, ici, ne remplace pas le jugement esthétique ; il le prolonge. La machine ne dit pas ce qu’est le style, mais montre qu’il existe, singulier, mesurable, irréductible à une autre plume.

Une science entre littérature et tribunal

Si l’affaire Molière amuse les érudits, la stylométrie quitte désormais les bibliothèques pour entrer dans les prétoires. L’analyse des messages anonymes, des lettres de menace, des tweets ou des blogs suspects fait partie des nouveaux outils de la police scientifique.

Dans le sillage de la linguistique judiciaire, ces méthodes permettent de déceler des régularités d’écriture, d’établir des rapprochements entre un auteur connu et un texte anonyme. L’empreinte stylistique, au même titre qu’une empreinte digitale, devient indice. Ainsi, dans le sillage du débat sur la paternité des œuvres de Molière, la stylométrie a quitté les amphithéâtres et les revues académiques pour se retrouver, trois siècles plus tard, au cœur d’affaires criminelles. Ce glissement n’a rien d’anecdotique : il raconte la manière dont une science de la nuance et de la trace est devenue un instrument de vérité judiciaire.

Dans les années 2010, les mêmes chercheurs qui avaient tranché la querelle Molière-Corneille — Florian Cafiero et Jean-Baptiste Camps — ont vu leurs travaux cités bien au-delà du monde des lettres. Leur ouvrage Affaires de style (Seuil, 2023) retraçait cette étonnante migration : comment les algorithmes conçus pour départager deux dramaturges du Grand Siècle s’appliquent désormais à identifier un corbeau moderne, auteur de lettres anonymes dans des dossiers criminels.

L’affaire Grégory, tragédie française parmi les plus scrutées du XXᵉ siècle, en constitue l’exemple le plus saisissant. Depuis le 16 octobre 1984, date de la découverte du corps du petit Grégory Villemin dans les eaux de la Vologne, les enquêteurs se heurtent à une énigme : qui a écrit les dizaines de lettres de menace et d’insultes adressées à la famille ? Ces écrits, saturés de rancune et de ressentiment, ont longtemps défié les graphologues, les experts en linguistique, les juges.

Quarante ans plus tard, la stylométrie a rouvert une brèche. À la demande des magistrats, un laboratoire suisse spécialisé dans l’analyse statistique du langage a comparé les lettres anonymes à des écrits personnels de plusieurs protagonistes du dossier. En 2025, les résultats ont conduit à la mise en examen de Jacqueline Jacob, la grand-tante de l’enfant, sur la base de similitudes fortes entre ses tournures d’écriture et celles des lettres du « corbeau ». Les experts ont relevé des coïncidences répétées dans le choix des mots-outils, la ponctuation, le rythme des phrases, mais aussi dans des détails syntaxiques réputés impossibles à imiter consciemment.

Cette mise en examen est une avancée importante souligne l'avocate des parents de Grégory. "Une avancée pourquoi ? Un, parce que ça démontre que la justice n'abandonne pas. Et deux, parce que non seulement elle n'abandonne pas, mais elle montre qu'elle se donne tous les moyens pour continuer", félicite Me Marie-Christine Chastant-Morand.

L’affaire Ramadan : la stylométrie au cœur d’un double mensonge

Dans les dossiers suisse et français visant Tariq Ramadan, la stylométrie a fait surgir un tournant inattendu. Mandatée par la défense, la docteure en Linguistique judiciaire américaine Carole E. Chaski a analysé, à l’aide de sa méthode brevetée SynAID, plusieurs séries de message attribués à deux de ses accusatrices, l’une en Suisse, l’autre en France. Son expertise, fondée sur l’étude de milliers de structures syntaxiques, conclut que les messages litigieux ont été rédigés par les deux plaignantes elles-mêmes, avec un taux de fiabilité supérieur à 97 %.

"La stylometrie est une technique scientifique qui se base sur les espaces, la ponctuation, la synthaxe d'un texte, afin de l'approprier à un auteur donné, explique Me Pascal-Pierre Garbarini. Cette technique n’était pas aussi approfondie il y a sept ans. Aujourd’hui c’est différent. Elle est assistée par ordinateur. Nous avons sollicité des experts de renommée mondiale. Ils ont analysé les procédures, et leurs résultats permettent de certifier que l’accusatrice, qu’on appelle en France Christelle, avait préparé en amont un plan pour nuire à Tariq Ramadan. Cette expertise balaye d’un revers de main tout le récit de cette femme." exprime l'avocat de Tariq Ramadan à nos confrères de France Info.

L’expertise révèle ainsi que ces deux femmes avaient évoqué l’idée de "piéger” Tariq Ramadan avant toute rencontre : l’une lors de sa première prise de contact avec le prédicateur, l’autre six jours avant leur unique rendez-vous. Toutes deux ont nié être à l’origine de ces écrits même si elles avaient confirmé qu'il s'agissait de leur pseudonyme. La stylométrie, en identifiant l’auteur invisible derrière les mots, s’impose ainsi comme un acteur central d’une affaire où la preuve ne réside plus seulement dans les faits, mais dans la syntaxe. Sur la base stylométrique, ses avocats suisses ont déposé une demande de révision de son procès. Le prédicateur avait été condamné en appel à Genève en septembre 2024 à trois ans de prison dont un ferme. Sa condamnation est devenue définitive en août dernier. Et il a décidé de saisir la Cour européenne des Droits de l’homme (CEDH). La stylométrie vient donc confirmer la version première de la brigade criminelle qui n'avait pas été prise en compte en France dans ce dossier, nous confie un journaliste proche du dossier.

La vérité à l’épreuve des mots

De Molière à Grégory, de Grégory à Ramadan, la stylométrie trace un même sillon : celui d’une science du langage capable de révéler ce que les mots dissimulent. Dans la querelle littéraire, elle a restitué à l’auteur son œuvre ; dans le drame judiciaire, elle a redonné voix à l’écrit anonyme ; dans le procès contemporain, elle interroge la sincérité même des accusations.

Dans les lignes de Marianne, le chroniqueur Alain Bauer souligne que "Les progrès technologiques bouleversent les méthodes d’enquête criminelle. De la stylométrie à l’intelligence artificielle, en passant par les capteurs nanométriques, les outils de la police scientifique deviennent toujours plus précis et sophistiqués".

Cette empreinte, désormais mesurable, bouleverse notre rapport à la preuve. Elle rappelle que dans une époque saturée de discours et de traces numériques, l’écriture devient un témoin à part entière, parfois plus fiable que la mémoire ou le récit. En franchissant les frontières entre littérature, enquête et justice, la stylométrie ne se contente plus d’éclairer le passé : elle redéfinit la manière dont se construit la vérité. Et, qu’il s’agisse d’un dramaturge du Grand Siècle ou d’un accusé du XXIᵉ, elle pose toujours la même question : qui parle, et jusqu’où peut-on le prouver ?