Le manuscrit COPIALE

Un manuscrit crypté complexe qui avait un sens intrinsèque et un secret à préserver

105 pages, contenant environ 75 000 caractères manuscrits. L'écriture est extrêmement soignée. Certains caractères sont des lettres romaines (comme que a et b), tandis que d'autres sont abstraites symboles (comme 1 et <).

Le contenu en images ici

  • Les lettres romaines apparaissent en majuscules et en minuscules. Les lignes du texte sont à la fois alignés à gauche et à droite. Il y a peu de corrections de l'auteur. Il n'y a pas d'espacement des mots. Il n'y a pas des illustrations ou des séparations de chapitres, mais le texte est formaté avec des paragraphes en retrait ou des lignes centrées.

  • Les paragraphes et les titres de section toujours commencent par les lettres romaines (en majuscule).

  • Les seules inscriptions non-chiffrées dans le livre sont "Philipp 1866" et "Copiales 3", ce dernier mot ayant servi à nommer le manuscrit
  • Il y a environ 90 formes de lettres : dont les 26 lettres romaines non accentuées,a-z. Les lettres c, h, m, n, p, r, s, et x ont des formesaccentuées (points), tandis que la lettre i a une forme spécifique sans point. Les lettres m, n, r et u ont des varianteset les voyelles ont des variantes avec accents circonflexes.

    Basé au départ sur l'analyse de fréquence, des regroupements de lettres ont été effectués pour voir celles lesquelles revenaient le plus dans tel ou tel contexte. L'équipe de recherche a utilisé le logiciel Scipy (http://users.soe.ucsc.edu/ ~ EADS / cluster.html) pour exécuter et tracer un regroupement qui progressivement fusionne des lettres semblables (et des groupes de lettres) dans un schéma d'un entonnoir renversé (de bas en haut).

    S'appuyant sur l'auto-similarité des lettres romaines, la première théorie était que les lettres romaines contenaient leur propre information dans le code chiffré et que tous les autres symboles sont NULL (pour réduire le sens aux lettres "lisibles"). Si nous enlevons tous les autres symboles, les lettres restantes romaines suivent une distribution du langage naturel, avec la lettre la plus populaire se produisant 12% du temps, et les lettres les moins populaires se produisent rarement. La séquence des lettres romaines selon les fréquences est en soi sans sens, de sorte que l'équipe de recherche a considéré un simple chiffrement par substitution. Des cryptanalyses de type "force brute" ont été menées sur les lettres romaines d'abord en supposant le texte comme étant de source allemande, puis anglaise, puis latine, puis quarante autres langues européennes et extra-européennes ont été testées.

    L'équipe note : "nous avons ensuite abandonné notre théorie concernant les caractères NULL et posé un code homophonique, avec chaque lettre en clair pouvant être chiffrée par n'importe quelles lettres de chiffrement distinctes. Alors qu'un excellent chiffrement homophonique fera appel à une distribution de fréquences de lettres plate, pour confondre l'analyse, nous avons supposé que le chiffrement de Copiale n'est pas optimisé de cette façon.

    copiale
    (code « homophonique » : c’est-à-dire qu’un caractère originel peut être codé par plusieurs signes, dont le nombre est proportionnel à la fréquence habituelle de ce caractère dans la langue originelle).

    Nous avons confirmé que notre méthode de "force brute" ne donne en fait pas un code homophonique synthétique. Malheureusement, tous les résultats de déchiffrement ont été sans sens apparent, bien qu'il y eut une très légère préférence pour l'allemand comme langue originelle.

    Nous avons ensuite décidé de se concentrer sur l'allemand comme le plus vraisemblablement celui de la langue en clair, pour trois raisons : le livre se trouve en Allemagne, la "force brute" a donné une très légère préférence à l'allemand, le livre se termine avec l'inscription "Philipp 1866 ", en utilisant le double p allemand."

    Après plusieurs clefs de recherche, l'équipe poursuit : "Sur la dernière ligne, nous avons reconnu les deux mots CÉRÉMONIE et DER séparés par une lettre codée. Il est devenu évident que les lettres romaines non accentuées servaient comme des espaces dans le code (ceci était l'opposé de notre première approche de décryptage). Les lettres non romaines ne sont pas "null" et apportent de l'information. Cela explique aussi pourquoi les paragraphes commencent par des lettres capitales romaines, qui font joli, mais n'ont pas de sens particulier."

    Après avoir utilisé le site www.freetranslation.com (allemand vers l'anglais), l'équipe a repéré de nouveaux mots, et des hypothèses de correspondance entre les textes clair et codé.

    Le livre décrit l'initiation des "DER CANDIDAT "dans une société secrète, certaines fonctions sont encodées avec logogrammes. Ce document décrit les étranges pratiques d’une secte secrète inconnue particulièrement intéressée par l’ophtalmologie. On y apprend dans le détail le déroulement de cérémonies d’intronisations de nouveaux membres.