L'étrange quête pour déchiffrer le code Voynich

C’est un mystère vieux d’environ 600 ans qui continue de laisser perplexes les chercheurs, les cryptographes, les physiciens et les informaticiens : un codex médiéval d’environ 240 pages écrit dans une langue indéchiffrable, débordant de dessins bizarres de plantes ésotériques, de femmes nues et de symboles astrologiques. Connu sous le nom de manuscrit de Voynich, il défie toute classification, et encore moins toute compréhension.

Et pourtant, au fil des ans, un flot continu de chercheurs a surgi avec de nouvelles affirmations pour percer ses secrets. L’été dernier, un anthropologue du Foothill College en Californie a déclaré que le texte était un « dialecte latin vulgaire » écrit dans une obscure sténographie romaine. Et plus tôt dans l’année, Gerard Cheshire, un universitaire de l’Université de Bristol, a publié un article à comité de lecture dans la revue Romance Studies soutenant que l’écriture est un mélange de langues qu’il a appelé « proto-roman ».

Certains chasseurs de Voynich croient que la recherche peut être un « pur poison » pour une carrière d’érudit naissante, car lors de l’étude du manuscrit, il y a « toujours une option facile de faire une erreur ridicule. »

Cependant, jusqu’à présent, chaque revendication d’une solution Voynich – y compris les deux de l’année dernière – a été soit ignorée soit démentie par d’autres experts, des médias et des obsessionnels du Voynich. Dans le cas de Cheshire, l’Université de Bristol a rétracté un communiqué de presse mettant en avant son article après que d’autres experts aient vertement contesté ses recherches.

Le physicien Andreas Schinner a raconté une rumeur selon laquelle le manuscrit Voynich peut être un « pur poison » pour une carrière d’érudit, car lors de l’étude du manuscrit, il y a « toujours une option facile de faire une erreur ridicule. »

« Le monde universitaire est une jungle », a écrit dans un courriel Schinner, qui a été le premier à appliquer l’analyse statistique au manuscrit il y a plus de dix ans, « et comme dans toute jungle, il n’est pas recommandé de montrer une faiblesse même potentielle. »

Tout ce que nous savons avec certitude, grâce aux tests médico-légaux, c’est que le manuscrit date probablement du 15e siècle, à une époque où les livres étaient faits à la main et rares. Mais sa provenance et sa signification sont incertaines, ce qui rend pratiquement impossible de corroborer toute affirmation sur son contenu par rapport à d’autres matériaux historiques.

Alors pourquoi tant de chercheurs et de scientifiques sont poussés à résoudre cette énigme ? Pour beaucoup, c’est l’occasion ultime de prouver leurs compétences analytiques dans leurs domaines donnés. Pour d’autres, c’est l’occasion de tester de nouvelles technologies numériques prometteuses et les progrès de l’intelligence artificielle. Et pour d’autres encore, c’est tout simplement le frisson de la chasse.

Avec des images qui échappent à l’interprétation et un langage qui reste à déchiffrer, le manuscrit du XVe siècle continue de dérouter les chercheurs. Visual : Wikimedia/Public Domain

Le manuscrit a été acquis en 1912 par Wilfrid Voynich, un marchand de livres rares polonais. Ressemblant à un livre moderne plutôt qu’à un parchemin, il est rempli de textes manuscrits en boucle écrits dans une écriture élaborée, accompagnés de somptueuses illustrations. La découverte n’a pas rendu Voynich riche, mais le manuscrit a continué à faire les gros titres pendant plus de cent ans, défiant les chercheurs dans de nombreux domaines, notamment la linguistique, la botanique et l’apprentissage automatique. Il se trouve désormais à la bibliothèque Beinecke de l’université de Yale.

Au début, il a surtout attiré les chercheurs en sciences humaines. En 1921, William Newbold, un philosophe de l’université de Pennsylvanie qui s’intéressait à la cryptographie, a affirmé qu’un frère du XIIIe siècle l’avait écrit comme un traité scientifique. Newbold pensait que chaque lettre obscure était en fait une collection de symboles minuscules lisibles à l’aide d’un grossissement adéquat, ce qui signifiait que le microscope avait été inventé des siècles avant que nous le pensions. Après la mort de Newbold, John Manly, professeur de littérature américain et collègue décrypteur, a réfuté la théorie de Newbold, montrant que ses méthodes étaient arbitraires et scientifiquement peu fiables.

William et Elizebeth Friedman, deux figures fondatrices du décryptage moderne, ont continué à appliquer les techniques de décryptage au manuscrit. Bien qu’ils aient étudié d’autres textes et qu’ils aient été recrutés pour craquer des messages pendant les deux guerres mondiales, ils n’ont jamais réussi à trouver une solution pour le Voynich.

Pendant la Première Guerre mondiale, les Friedman ont dû effectuer leurs calculs à la main, mais dans les décennies suivantes, les machines à tabuler à cartes perforées d’IBM ont rendu le processus beaucoup plus rapide. Travaillant avec la National Security Agency lors de sa création dans les années 1950, William et d’autres décrypteurs se sont intéressés au manuscrit médiéval (il en existe même une copie dans la bibliothèque interne de la NSA). Comme le manuscrit n’était pas classifié, les casseurs de code de la guerre froide pouvaient l’utiliser pour illustrer les techniques d’analyse informatique de pointe à leurs collègues sans utiliser de véritables messages soviétiques.

Les recherches récentes sur le Voynich s’appuient également beaucoup sur l’analyse informatique, mais avec des outils beaucoup plus sophistiqués. Lisa Fagin Davis, une médiéviste qui suit les recherches sur le Voynich depuis les années 1990, affirme que les « progrès incroyables de la puissance informatique » ont également contribué à démystifier les solutions proposées : « Nous avons un moyen d’analyser et de critiquer les solutions publiées de manière sophistiquée et presque inattaquable », dit-elle.

Les illustrations mystérieuses sont également un attrait pour certains chercheurs. Le botaniste Arthur Tucker affirme depuis 2013 que les plantes de Voynich étaient originaires des Amériques du XVIe siècle. Dans un récent courriel, il a déclaré que son approche non informatique de l’interprétation de chacune des illustrations botaniques a suscité la colère de scientifiques plus axés sur les données, dont il a rejeté les méthodes, sans les développer, en les qualifiant de « raisonnement circulaire ». Mais sa théorie n’a pas trouvé preneur auprès des botanistes ou des scientifiques spécialisés dans les données.

Les « progrès incroyables de la puissance de calcul » ont été le plus grand moteur de la recherche actuelle, en particulier dans l’analyse linguistique, où les transcriptions numériques de l’étrange écriture rendent possible l’application de nouveaux algorithmes au problème du décodage de sa signification.

En ce qui concerne Schinner, il dit avoir été attiré par les tentatives d’autres scientifiques : « Peut-être que je voulais juste savoir si je pouvais faire mieux que ça ».

Utilisant la « cartographie de la marche aléatoire » tirée des mathématiques et appliquée à des chaînes de caractères, il a suggéré en 2007 que le texte était généré à partir d’un processus stochastique sous-jacent – du hasard comme la fréquence de chute des gouttes de pluie – et non d’un langage naturel, qui a une structure. Un second article, dont il est le coauteur en 2019, développe sa théorie pour proposer un algorithme de génération possible du texte, suffisamment simple pour qu’un scribe médiéval ait pu le faire comme un canular. Leurs recherches semblent soutenir l’idée que le manuscrit n’a pas de sens.

D’autres études récentes contredisent la conclusion de Schinner. En 2013, une équipe de scientifiques du Brésil et d’Allemagne a effectué ses propres analyses statistiques et a tiré la conclusion inverse : Le texte était probablement écrit dans une langue, et non généré de façon aléatoire. En 2016, Greg Kondrak, informaticien à l’université d’Alberta, et son étudiant, Bradley Hauer, ont déployé un algorithme d’apprentissage automatique entraîné sur 380 traductions du même bloc de texte pour proposer que le contenu est de l’hébreu pêle-mêle, écrit dans une écriture étrange.

Un ingénieur turc et son fils, quant à eux, émettent la théorie que l’écriture est une transcription phonétique d’un dialecte turc médiéval et prévoient de publier un article sur leurs conclusions en 2020. Et un article sur les statistiques publié en novembre décrit comment l’analyse visuelle des lettres a identifié des modèles dans l’écriture elle-même qui semblent similaires à d’autres alphabets écrits.

« Tout le monde veut être celui qui le prouve, qui le déchiffre, qui prouve ses propres capacités, qui prouve qu’il est plus intelligent », dit Davis, la médiéviste. Un problème, ajoute-t-elle, surtout avec un manuscrit médiéval complexe, est que les chercheurs sont des spécialistes. « Il n’y a pratiquement personne qui comprenne toutes les composantes du manuscrit », souligne-t-elle, faisant référence non seulement aux illustrations, mais aussi à des éléments comme la reliure, les encres et l’écriture. « Il faudra toute une équipe interdisciplinaire. »

Elle cite la controverse sur l’analyse linguistique de Cheshire comme un exemple des limites de la publication savante. Bien que son article ait fait l’objet d’un examen par les pairs – ce qui est normalement l’étalon-or de la rigueur scientifique – les examinateurs étaient très probablement des spécialistes des langues romanes, puisque l’article a été publié dans une revue d’études romanes. Et l’évaluation par les pairs est un processus souvent opaque, même pour des sujets bien moins obscurs qu’un manuscrit vieux de 600 ans. Pour sa part, Cheshire reste confiant dans son travail, établissant une distinction entre lui et d’autres prétendus déchiffreurs de codes : Il a raison, et ils ont tort. « C’est simple, vraiment », dit-il.

« Tout le monde veut être celui qui le prouve, qui le déchiffre, qui prouve ses propres capacités, qui prouve qu’il est plus intelligent. »

Pour les autres chercheurs de Voynich, l’essentiel est ce que l’on apprend en cours de route. Au cours des cinq dernières années, des revues couvrant la linguistique informatique, la physique, l’informatique et la cryptologie ont publié des articles sur Voynich, certains démystifiés par la suite, mais beaucoup d’autres exposant une nouvelle approche de l’analyse du texte plutôt que de revendiquer définitivement une solution. Dans ces derniers cas, l’objectif peut être principalement de présenter de nouveaux outils qui peuvent être applicables à d’autres domaines.

Les algorithmes d’intelligence artificielle, par exemple, nécessitent souvent de grands ensembles de données pour l’entraînement et les tests avant de pouvoir être largement appliqués, et l’analyse du manuscrit Voynich peut aider les physiciens et d’autres scientifiques à tester si de nouvelles méthodes de traitement des nombres peuvent identifier des modèles significatifs dans de grandes quantités de données abstraites.

L’article de physique brésilien de 2013 a utilisé le manuscrit Voynich pour illustrer comment les méthodes de physique statistique peuvent être adaptées pour trouver des modèles linguistiques cachés et a conclu que le texte ne semblait pas généré au hasard. Quant à l’article de Kondrak et Hauer sur l’apprentissage automatique, il se concentre principalement sur la description des algorithmes d’analyse linguistique qu’ils ont utilisés pour détecter l’hébreu comme langue sous-jacente. Même si aucune des deux théories n’a été acceptée comme solution pour Voynich, elles peuvent néanmoins se révéler efficaces dans d’autres domaines.

Wilfrid Voynich parmi ses livres à Soho Square à Londres. Visuel : Domaine public

Comme le dit Schinner, « on ne sait jamais ce qui va se passer quand on applique telle ou telle méthode », puisque le contenu du manuscrit reste inconnu. Tout ce que les chercheurs apprennent par essais et erreurs peut les aider à « développer des techniques qui peuvent être utilisées plus tard sur des problèmes pratiques », dit Kondrak.

En fin de compte, le manuscrit peut simplement être un mystère insoluble. Robert Richards, historien des sciences à l’Université de Chicago, utilise le codex pour enseigner le concept de paradigmes scientifiques, lorsqu’une théorie scientifique vient façonner un domaine de recherche si fortement que les scientifiques ne peuvent pas toujours expliquer ou identifier les anomalies en dehors de la théorie.

Richards compare le texte Voynich au langage impénétrable utilisé par les extraterrestres débarquant sur Terre dans le film « Arrival » de 2016 : Nous ne sommes même pas sûrs qu’il s’agisse vraiment d’un langage, tant il est en dehors de notre paradigme linguistique. Bien qu’il semble qu’il signifie quelque chose, dit-il, « nous pourrions en être assurés seulement si nous pouvons le traduire dans notre langue. »

Qui sait, dit-il du manuscrit Voynich : « Il se peut que ce ne soit, après tout, qu’une plaisanterie médiévale sans queue ni tête. »

Jillian Foley est étudiante diplômée à l’Université de Chicago, où elle étudie l’histoire de la cryptographie et de l’informatique. Son travail a été publié dans Slate et Technology’s Stories.

L’étrange quête pour déchiffrer le code Voynich

Laisser un commentaire Annuler la réponse