Automatizált kódfejtés

2014.12.20. 14:33

A titkosított jelsorozatok automatikus számítógépes megfejtése régóta napirenden van. Kiváló módszer érhető el például mai angol nyelvű szövegek titkosított változatainak gyors megfejtésére. Az ember csak bemásolja a megfejtendő üzenetet, és a program rögtön kiadja a megfejtést. A szoftver nyílt forráskódú, hatalmas angol nyelvű mintaszövegből generál gyakoriságtáblázatokat és szó-mintákat, és ezeket hasonlítja össze a kódszöveg jelgyakoriságával és karaktermintáival. Előnye, hogy gyors, hátránya, hogy kizárólag kortárs angol szövegekkel tud dolgozni, és azokat is csak akkor fejti meg, ha monoalfabetikusan vannak kódolva. 

Többféle kódtípus feltörésére alkalmas a világhírű titkosírástörténész, Simon Singh interaktív weboldala, a monoalfabetikus rejtjelek mellett homofonikus, sőt polialfabetikus kódok feltörésére is használható, de jelentősen több emberi találékonyságra van szükség az alkalmazásához, nem annyira automatikus, mint az előbbi.

A kettő előnyeit egyesíti, és több nyelvre is alkalmas a folyamatosan fejlesztett Cryptool, amelyből éppen a kettes számot viselő a legújabb verzió.

Bár e programok, alkalmazások és weboldalak előnyeit nem győzöm hangsúlyozni, sajnos tagadhatatlan, hogy nem sokat érnek akkor, amikor valódi történelmi titkosírásokat szeretnénk feltörni. A kortárs angol szövegek alapján készített frekvencia táblázatok és szómintázatok keveset segítenek abban, hogy egy tizenhetedik századi latin, német, magyar, francia vagy olasz szöveget megfejtsünk. Ez a felismerés áll a hátterében néhány újabb fejlesztésnek, amely az adott kor szövegkorpuszából igyekszik kiindulni akkor, amikor a szoftver a nyelvi jellegzetességeket feltérképezi. 

Az egyik ilyen - részben saját fejlesztésű - program, amelynek működéséről korábban írtam, bármilyen korú és nyelvű szövegkorpusszal tud dolgozni, abból számít mintázatokat és frekvenciákat. Leghatékonyabban olyankor használható, amikor titkosítási technikegyszerű, a nyelvi feladat azonban összetett: fel kell ismerni egy különös, még a 17. században sem létezett, mert a rejtjel céljára megváltoztatott nyelvet. szoftver tehát olyan helyzetek kezelésére készült, amelyekben nem a kriptográfai eszköz kifinomultsága, hanem a nyelvi helyzet komplexitása okozza a problémát. A cél az, hogy kellő mennyiségű alapszöveg megléte esetén a program teljesen önjáró legyen, minél kevesebb beavatkozást igényeljen a felhasználótól.

 kep1.png

 

 

 

iii_ferd.pngAz eddigi vállalkozásoknál nagyságrendekkel nagyobb dimenziójú az a projekt, amelyet a Copiale kézirat megfejtőiként ismert Megyesi Beáta és Kevin Knight fejleszt. Távlati céljuk, hogy a titkosított levéltári kézirat beszkennelésétől a teljes megfejtésig a folyamat egésze automatizálva legyen, rövid távon azonban az első lépést, az automatikus karakterfelismerést átmenetileg emberi erőre bízzák (és így konvertálódik az itt látható, egyébként III. Ferdinándtól származó rejtjelezett levél a számítógép által is kezelhető, alább látható karaktersorozattá). Ezután azonban minden további lépést a számítógép intéz. A terv az, hogy a program a titkosírásos szöveg kódolási technikáját is azonosítsa, majd az alkalmazott technika ismeretében a megfelelő kódfejtési módszerrel támadja. A szoftver nyelvstatisztikai vizsgálattal még a megfejtés előtt megállapítja, hogy mi lehet a kódolt szöveg alapnyelve. 

iii_ferd2.png

Egyelőre hiú ábránd, hogy a rejtjelezett forrást a szkennerbe illesztve könnyű szívvel kávézni induljunk abban a reményben, hogy visszatértünkkor a megfejtés egy szoftver jóvoltából az asztalunkon fog várni. Sőt, számos olyan történelmi áll ma is ellen a kódfejtőknek, amelyről azt gondoljuk, minden bizonnyal csak emberi erőfeszítésnek fogja megadni magát. De elnézve egyfelől a technika fejlődését, másfelől pedig a szakemberek elszántságát, a történészek, informatikusok és számítógépes nyelvészek együttműködését, joggal remélhetjük, hogy a szkennelős-kávézós modell a nem is annyira távoli jövő fejleménye lesz.

A bejegyzés trackback címe:

http://kripto.blog.hu/api/trackback/id/tr236942161

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben.

Nincsenek hozzászólások.