Lrtsjerk sera-t-il un charlatan ?

Chicberfluff. Snizzlewump. Wobblefizz. Trois pseudo-mots inventés par ChatGPT la semaine dernière. Heddwen Newton, professeur d’anglais, avait mis le robot au défi de « générer une liste de mots absurdes ». Bien sûr, dit le logiciel, évoquant blibberquark en zonkledoodle.

Logiquement, s’il y a une logique dans le non-sens, le charabia nous dit plusieurs choses. Premièrement, l’algorithme est friand de composés et de polysyllabes, dans la veine jabberwocky. Deuxièmement, le guff est prononçable, avec un rapport convenable entre voyelles et consonnes, y compris l’appariement orthodoxe QU. En tant qu’absurdité, le quackleflop a du sens, même si Heddwen avait des scrupules.

ChatGPT a proposé des mots absurdes similaires à ceux du Jabberwocky de Lewis Carroll.Crédit:

Le problème venait de lrtsjerk, qui ne figurait pas sur la liste. La curiosité est apparue le mois dernier, un étrange poisson attrapé par Google Alerts. Passionné d’anglais et surtout de son évolution, Newton rédige une newsletter mensuelle intitulée Anglais en cours, un festival de liens dynamique vers du nouvel argot, du jargon, des accents et tout le reste. Par hasard, lrtsjerk avait croisé son chemin en raison de sa prétendue définition : « un terme inventé pour décrire une tendance linguistique caractérisée par une faute d’orthographe ou une altération intentionnelle des mots ».

Dit qui, a demandé le blogueur linguistique. Des recherches plus poussées ont révélé davantage de significations, chacune plus loufoque que la précédente. Selon une série de sites Web douteux, lrtsjerk signifiait un groupe de connards en ligne, un pays magique, une façon de penser radicale ou « un entraînement complet avec des racines anciennes ». Comparé aux mots absurdes de ChatGPT, ce glossaire était une poubelle.

Pourtant, il était là, bien en vue. Des chapes entières soutenant un mot qu’aucun dictionnaire ou source d’information n’avait jamais rencontré. Une enquête diligente a fait remonter l’étrangeté à septembre 2023, peut-être la première citation. Il est difficile d’en être sûr. La main invisible du texte généré par l’IA était bien plus claire en jeu, cherchant à donner de la dignité à la nouveauté.

Comme l’explique Heddwen, « les textes sur l’IA se démarquent, car ils sont souvent longs, répétitifs, contradictoires et ne cite pas les sources. » D’autres indices sont également évidents, du moins pour l’instant, notamment la disposition du contenu préliminaire, ainsi que les questions et réponses en bas. Mais cela pourrait changer, faisant de cette affaire de lrtsjerk un présage, et non un bon. Qu’un non-mot reçoive un faux statut de mot, sur au moins six sites hokey, peut glacer le sang d’un lexicographe.

Covfefe, bien sûr, la gaffe de Trump de 2017, était un charabia d’origine humaine. Né d’un accident ou de circonstances ponctuelles, le mot occasionnel ne signifiait rien jusqu’à ce qu’il en vienne à désigner l’erreur elle-même, un drôle de raccourci pour une erreur du gros doigt. Lrtsjerk pourrait-il formuler des affirmations similaires, ou est-ce plus insidieux ? Moins une faute de frappe qu’un « algo », né d’octets ou d’un design astucieux ? Est-ce le premier mot né de l’IA de notre vie, ou la farce d’un intrus anonyme ?

Ou peut-être un mot fantôme, un faux terme qui commence comme fabriqué, pour ensuite être répertorié comme authentique par un ouvrage de référence en raison d’une mauvaise interprétation lexicale ? Dord, par exemple, est apparu dans l’édition Webster de 1934 comme synonyme de densité. Faux. Le non-mot était une lecture erronée de « D ou d », signifiant densité, mais cette erreur est devenue brièvement légitime.