Automatizált kódfejtés
2014.12.20. 14:33
A titkosított jelsorozatok automatikus számítógépes megfejtése régóta napirenden van. Kiváló módszer érhető el például mai angol nyelvű szövegek titkosított változatainak gyors megfejtésére. Az ember csak bemásolja a megfejtendő üzenetet, és a program rögtön kiadja a megfejtést. A szoftver nyílt forráskódú, hatalmas angol nyelvű mintaszövegből generál gyakoriságtáblázatokat és szó-mintákat, és ezeket hasonlítja össze a kódszöveg jelgyakoriságával és karaktermintáival. Előnye, hogy gyors, hátránya, hogy kizárólag kortárs angol szövegekkel tud dolgozni, és azokat is csak akkor fejti meg, ha monoalfabetikusan vannak kódolva.
Többféle kódtípus feltörésére alkalmas a világhírű titkosírástörténész, Simon Singh interaktív weboldala, a monoalfabetikus rejtjelek mellett homofonikus, sőt polialfabetikus kódok feltörésére is használható, de jelentősen több emberi találékonyságra van szükség az alkalmazásához, nem annyira automatikus, mint az előbbi.
A kettő előnyeit egyesíti, és több nyelvre is alkalmas a folyamatosan fejlesztett Cryptool, amelyből éppen a kettes számot viselő a legújabb verzió.
Bár e programok, alkalmazások és weboldalak előnyeit nem győzöm hangsúlyozni, sajnos tagadhatatlan, hogy nem sokat érnek akkor, amikor valódi történelmi titkosírásokat szeretnénk feltörni. A kortárs angol szövegek alapján készített frekvencia táblázatok és szómintázatok keveset segítenek abban, hogy egy tizenhetedik századi latin, német, magyar, francia vagy olasz szöveget megfejtsünk. Ez a felismerés áll a hátterében néhány újabb fejlesztésnek, amely az adott kor szövegkorpuszából igyekszik kiindulni akkor, amikor a szoftver a nyelvi jellegzetességeket feltérképezi.
Az egyik ilyen - részben saját fejlesztésű - program, amelynek működéséről korábban írtam, bármilyen korú és nyelvű szövegkorpusszal tud dolgozni, abból számít mintázatokat és frekvenciákat. Leghatékonyabban olyankor használható, amikor a titkosítási technika egyszerű, a nyelvi feladat azonban összetett: fel kell ismerni egy különös, még a 17. században sem létezett, mert a rejtjel céljára megváltoztatott nyelvet. A szoftver tehát olyan helyzetek kezelésére készült, amelyekben nem a kriptográfai eszköz kifinomultsága, hanem a nyelvi helyzet komplexitása okozza a problémát. A cél az, hogy kellő mennyiségű alapszöveg megléte esetén a program teljesen önjáró legyen, minél kevesebb beavatkozást igényeljen a felhasználótól.
Az eddigi vállalkozásoknál nagyságrendekkel nagyobb dimenziójú az a projekt, amelyet a Copiale kézirat megfejtőiként ismert Megyesi Beáta és Kevin Knight fejleszt. Távlati céljuk, hogy a titkosított levéltári kézirat beszkennelésétől a teljes megfejtésig a folyamat egésze automatizálva legyen, rövid távon azonban az első lépést, az automatikus karakterfelismerést átmenetileg emberi erőre bízzák (és így konvertálódik az itt látható, egyébként III. Ferdinándtól származó rejtjelezett levél a számítógép által is kezelhető, alább látható karaktersorozattá). Ezután azonban minden további lépést a számítógép intéz. A terv az, hogy a program a titkosírásos szöveg kódolási technikáját is azonosítsa, majd az alkalmazott technika ismeretében a megfelelő kódfejtési módszerrel támadja. A szoftver nyelvstatisztikai vizsgálattal még a megfejtés előtt megállapítja, hogy mi lehet a kódolt szöveg alapnyelve.
Egyelőre hiú ábránd, hogy a rejtjelezett forrást a szkennerbe illesztve könnyű szívvel kávézni induljunk abban a reményben, hogy visszatértünkkor a megfejtés egy szoftver jóvoltából az asztalunkon fog várni. Sőt, számos olyan történelmi áll ma is ellen a kódfejtőknek, amelyről azt gondoljuk, minden bizonnyal csak emberi erőfeszítésnek fogja megadni magát. De elnézve egyfelől a technika fejlődését, másfelől pedig a szakemberek elszántságát, a történészek, informatikusok és számítógépes nyelvészek együttműködését, joggal remélhetjük, hogy a szkennelős-kávézós modell a nem is annyira távoli jövő fejleménye lesz.
Szerző: Benedek Lang
Szólj hozzá!
Címkék: Források Láng Benedek Simon Singh Kódfejtés Megyesi Beáta Kevin Knight
A bejegyzés trackback címe:
Kommentek:
A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.