Ennos kodierte XE-Artikel

Im Xontormia Express hat Enno (aka Lord Infrarot von den Spektralelfen, Tanstaafl oder Igjarjuk im IRC) seit einiger Zeit kodierte Artikel veröffentlicht. Obwohl die Kodierung ziemlich simpel ist, wurde im IRC doch öfters deutlich, daß nur wenige damit was anfangen können. Auf allgemeinen Wunsch (außer Ennos :->) habe ich daher hier die dekodierten Artikel abgelegt.

Allerdings besteht der ganze Spaß eigentlich darin, den Kram selber herauszufinden. Darum stehen weiter unten ein paar Tips, wie man die Artikel selber dekodieren kann. Man sollte also erstmal selber versuchen, den Code zu knacken.

Für alle Faulen hier die dekodierten Artikel:

Was ist das überhaupt?

Das ganze ist eigentlich ziemlich einfach: Es handelt sich um simple Ersetzung von Buchstaben. Sowas nennt man auch Substitutionschiffre, und ist in Informatik-Vorlesungen, die sich mit Verschlüsselungen befassen, eine beliebte Übungsaufgabe (bei uns einmal in der Netzwerke-VL, dort war es ein Auszug aus "Moby Dick"). Es wird einfach ein Buchstabe einem (mehr oder weniger zufällig gewählten) anderen Buchstaben zugeordnet, wobei diese Zuordnung natürlich eindeutig ist. Als Beispiel hier die Zuordnungen aus dem ersten Artikel:

A=t, B=o, C=k, D=y, E=u, F=x, G=a, H=w, I=n, J=c, K=i, L=b, M=v, N=s, O=f, P=m, Q=z, T=p, U=h, V=r, W=l, X=e, Y=g, Z=d.

Die bekannte rot13-Verschlüsselung ist übrigens auch eine solche einfache Substitutionschiffre, nur ist dort die Zuordnung der Buchstaben nicht zufällig gewählt.

Wie knackt man sowas?

Hier gibt es erstmal zwei Möglichkeiten: Wer sich den ersten Artikel mal ein wenig betrachtet, dem fällt schnell etwas auf: X kommt sehr häufig vor. Da X schon von seiner Form her ein recht auffälliger Buchstabe ist, springt das in diesem Fall natürlich sofort ins Auge. In der deutschen Sprache kommt das 'e' am häufigsten vor, daher ist es anzunehmen, daß X in diesem Fall einem 'e' entspricht. Theoretisch könnte man den gesamten Text mit einer Häufigkeitsanalyse knacken (die Häufigkeit der einzelnen Buchstaben in typischen Texten ist ziemlich gut bekannt), aber der Text ist relativ kurz, und das ist nicht besonders interessant.

Weitaus schneller schafft man das, wenn man einfach mal die sehr kurzen Worte (2 und 3 Buchstaben) betrachtet. Hier erstmal eine Auflistung von deutschen Wörtern mit zwei Buchstaben: ab, am, an, er, es, im, in, um, wo, zu. Vielleicht habe ich jetzt ein paar vergessen, aber eines ist klar: Einer der beiden Buchstaben ist ein Vokal, und die Konsonanten 'm' und 'n' sind sehr häufig vertreten. Jetzt die mit drei Buchstaben: auf, aus, der, die, das, dem, des, von, wer, wem, zum, ist, und. Hier habe ich mit Sicherheit eine ganze Menge Wörter vergessen, aber wenn man sich mal einen normalen Text betrachtet, so fällt schnell auf, daß 'der', 'die', 'das' usw. einen Großteil der 3-Buchstaben-Wörter ausmachen. Netterweise fangen die alle mit demselben Konsonanten an und haben an zweiter Stelle einen Vokal. Zusammen mit den 2-Buchstaben-Wörtern und ein klein wenig Überlegung kann man damit praktisch immer 'd', 'e' oder 'a' und ein oder zwei andere Buchstaben (häufig 'r' und 's', wegen der/er, des/es oder das/es) identifizieren. Damit hat man dann genug "Material", um die meisten anderen 3- und viele 4-Buchstaben-Wörter zu entschlüsseln: dZe ist sicherlich 'die', diV ist 'dir' oder 'die', XYd ist wahrscheinlich 'und', usw. Damit erhält man viele weitere Buchstaben, und der Rest ist dann ganz einfach.

Interessant sind im dritten Artikel noch die zwei Wörter JLXX und FLXX. Hier gibt es kaum Möglichkeiten: Sehr wahrscheinlich ist dann/wann oder denn/wenn. Es gibt noch ein paar andere Möglichkeiten (dass/nass/fass, ball/fall), aber die sind sehr unwahrscheinlich.

In den Eressea-Texten hat man zudem noch den Vorteil, daß man einiges über den allgemeinen Hintergrund weiß, und so einige Wörter leichter erraten kann.