L'intelligence artificielle a-t-elle fissuré le code mystérieux du manuscrit Voynich? / cryptographie

Un investissement émotionnel dans le manuscrit de Voynich offre peu de retour. Pendant des centaines d'années, ce document du XVe siècle, rempli d'écrits indéchiffrables et d'illustrations cryptiques, était sombre et impénétrable. Les chercheurs ont tendance à réfuter rapidement les tentatives visant à comprendre son code, qu'elles soient aussi sensées que «c'est le manuel de la santé d'une femme!» Ou aussi bizarres que «je pense qu'un étranger l'a fait». Alan Turing et le Les tentatives de décryptage de l’équipe de Bletchley Park ont été infructueuses. Aujourd'hui, à l'Université de l'Alberta, au Canada, des chercheurs ont choisi une nouvelle approche pour tenter d'éclairer le manuscrit, du nom du libraire polonais du XIXe siècle, Wilfrid Voynich. Là où les humains ont échoué, l'intelligence artificielle tente de prendre le relais. Il s’agit d’un développement préjudiciable pour les médiévistes et d’autres experts.

Grzegorz Kondrak est presque le contraire d'un médiéviste. Professeur d'informatique, il a découvert l'ancien mystère au sein de la communauté de l'intelligence artificielle. Dans le passé, il avait travaillé sur le traitement du langage naturel et souhaitait appliquer certaines des mêmes techniques au texte. Ce casse-tête notoirement difficile pose deux problèmes: il est écrit en code et personne ne sait quelle langue ce code code. En compagnie de Bradley Hauer, étudiant diplômé, Kondrak a utilisé 380 traductions de la Déclaration universelle des droits de l'homme pour identifier systématiquement le langage utilisé dans le texte. Dans le passé, les gens ont tout suggéré, du latin au charabia; Kondrak et Hauer pensaient que c'était peut-être l'arabe. Au lieu de cela, les algorithmes ont suggéré une alternative inattendue: l'ordinateur ressemblait à de l'hébreu..

"C'était surprenant", a déclaré Kondrak dans un communiqué. «Et simplement dire« c’est de l’hébreu », c’est la première étape. La prochaine étape consiste à savoir comment le déchiffrer. »Les scientifiques pensent que le code utilisé dans le manuscrit a peut-être été créé à l'aide d'alphagrams. (Dans les alphagrammes standard, les lettres d'un mot sont placées dans l'ordre alphabétique. L'alphagramme de «alphagram», par exemple, est «aaaghlpmr».) Les voyelles ont également été supprimées. Ces hypothèses faites, ils ont essayé de trouver un algorithme pour déchiffrer ce texte hébreu brouillé, avec un effet saisissant. "Il s'est avéré que plus de 80% des mots étaient dans un dictionnaire hébreu", a déclaré Kondrak.

Cependant, le défi consistait à essayer de savoir s’ils avaient un sens ensemble. Les érudits hébreux n'ayant pas réussi à s'imposer, les scientifiques se sont tournés vers un bastion numérique de la compréhension internationale: Google Translate. Après avoir corrigé quelques erreurs d’orthographe géniales, cette approche leur a donné une première phrase plutôt décente, a déclaré Kondrak, qui était interprétable et grammaticale. Selon tous ces algorithmes, la première phrase se lit comme suit: «Elle a formulé des recommandations à l'intention du prêtre, de l'homme de la maison, de moi-même et des gens.»

"C'est un peu étrange de commencer un manuscrit", a déclaré Kondrak, "mais c'est tout à fait logique." Leur travail a été publié dans le journal Transactions de l'association de linguistique computationnelle.

Cela peut sembler plausible à un profane, mais déjà les experts et les informaticiens de Voynich roulent des yeux devant ces efforts récents. Parlant à la Temps d'Israël, Le scientifique en hébreu, Shlomo Argamon, a fait part de ses commentaires. «Ils disent que cela ressemble plus à l'hébreu qu'à d'autres langues», a-t-il déclaré. «À mon avis, cela n’en dit pas nécessairement autant.» L’utilisation de Google Translate lui a également semblé peu scientifique. "Si vous tapez 17 fois la lettre" A ", Google Traduction vous donnera quelque chose qui ressemble à une phrase si vous louez suffisamment les yeux." D'autres spécialistes ont émis des doutes sur l'utilisation par les scientifiques de l'hébreu moderne, plutôt que médiéval..

Pour sa part, Kondrak ne semble pas avoir été perturbé par ces interjections. «Je ne pense pas que [le milieu universitaire soit] favorable à ce type de recherche», a-t-il déclaré à la presse canadienne. "Les gens craignent peut-être que les ordinateurs les remplacent." Peut-être, bien que les observateurs des manuscrits de Voynich puissent choisir de ne pas retenir leur souffle.