Se on noin 600 vuotta vanha mysteeri, joka edelleen askarruttaa tutkijoita, salakirjoittajia, fyysikoita ja tietojenkäsittelytieteilijöitä: noin 240-sivuinen keskiaikainen koodeksi, joka on kirjoitettu lukukelvottomalla kielellä ja joka on täynnä outoja piirroksia esoteerisista kasveista, alastomista naisista ja astrologisista symboleista. Se tunnetaan Voynichin käsikirjoituksena, ja sitä on vaikea luokitella, saati sitten ymmärtää.
Silti vuosien varrella tutkijat ovat jatkuvasti esittäneet uusia väitteitä sen salaisuuksien selvittämisestä. Juuri viime kesänä Kaliforniassa sijaitsevan Foothill Collegen antropologi julisti, että teksti oli ”vulgaaria latinan murretta”, joka oli kirjoitettu hämärällä roomalaisella pikakirjoituksella. Ja aiemmin tänä vuonna Bristolin yliopiston akateemikko Gerard Cheshire julkaisi Romance Studies -lehdessä vertaisarvioidun artikkelin, jossa hän väitti, että käsikirjoitus on sekoitus kieliä, joita hän kutsui ”protoromaniksi”.
Joidenkin Voynichin metsästäjien mielestä etsintä voi olla ”silkkaa myrkkyä” aloittelevalle tieteelliselle uralle, koska käsikirjoitusta tutkittaessa on ”aina helppo mahdollisuus tehdä naurettava virhe.”.”
Tähän mennessä muut asiantuntijat, tiedotusvälineet ja Voynich-pakkomielteiset ovat kuitenkin joko jättäneet huomiotta tai kumonneet jokaisen väitteen Voynich-ratkaisusta – mukaan lukien molemmat viime vuoden väitteet. Cheshiren tapauksessa Bristolin yliopisto perui hänen kirjoitustaan korostaneen lehdistötiedotteen sen jälkeen, kun muut asiantuntijat kyseenalaistivat jyrkästi hänen tutkimuksensa.
Fyysikko Andreas Schinner kertoi huhusta, jonka mukaan Voynichin käsikirjoitus voi olla ”puhdasta myrkkyä” tieteelliselle uralle, koska käsikirjoitusta tutkittaessa on ”aina helppo vaihtoehto tehdä naurettava virhe.”.”
”Akateeminen maailma on viidakko”, Schinner, joka ensimmäisen kerran sovelsi tilastollista analytiikkaa käsikirjoitukseen yli kymmenen vuotta sitten, kirjoitti sähköpostitse, ”ja kuten missä tahansa viidakossa, ei ole suositeltavaa osoittaa edes potentiaalisia heikkouksia.”
Rikosteknisen testauksen avulla tiedämme varmuudella vain, että käsikirjoitus on todennäköisesti peräisin 1400-luvulta, jolloin kirjat olivat käsintehtyjä ja harvinaisia. Mutta sen alkuperästä ja merkityksestä ei ole varmuutta, minkä vuoksi on käytännössä mahdotonta vahvistaa sen sisältöä koskevia väitteitä muihin historiallisiin aineistoihin nähden.
Miksi niin monet tutkijat ja tiedemiehet sitten pyrkivät ratkaisemaan arvoituksen? Monille se on äärimmäinen tilaisuus todistaa analyyttiset taitonsa omilla aloillaan. Toisille se on mahdollisuus testata lupaavia uusia digitaalisia teknologioita ja tekoälyn edistysaskeleita. Ja joillekin se on yksinkertaisesti metsästyksen jännitystä.
Käsikirjoituksen hankki vuonna 1912 puolalainen harvinaisten kirjojen kauppias Wilfrid Voynich. Se muistuttaa pikemminkin nykyaikaista kirjaa kuin kääröä, ja se on täynnä silmukoitua käsinkirjoitettua tekstiä, joka on kirjoitettu taidokkaalla käsikirjoituksella ja jota säestävät runsaat kuvitukset. Voynich ei rikastunut löydöstä, mutta käsikirjoitus on ollut otsikoissa yli sadan vuoden ajan ja haastanut tutkijoita monilla aloilla, kuten kielitieteessä, kasvitieteessä ja koneoppimisessa. Se sijaitsee nyt Yalen yliopiston Beinecke-kirjastossa.
Aluksi se kiinnosti lähinnä humanistisia tutkijoita. Vuonna 1921 Pennsylvanian yliopiston filosofi William Newbold, joka oli kiinnostunut kryptografiasta, väitti, että 1200-luvun munkki kirjoitti sen tieteellisenä tutkielmana. Newbold uskoi, että jokainen salattu kirjain oli itse asiassa kokoelma pikkuruisia symboleja, jotka olivat luettavissa asianmukaisella suurennoksella, mikä olisi tarkoittanut, että mikroskooppi oli keksitty vuosisatoja ennen kuin me luulimme. Newboldin kuoleman jälkeen John Manly, amerikkalainen kirjallisuuden professori ja koodinmurtajatoveri, kumosi Newboldin teorian osoittamalla, että hänen menetelmänsä olivat mielivaltaisia ja tieteellisesti epäluotettavia.
William ja Elizebeth Friedman, kaksi modernin salakirjoitusten murtamisen uranuurtajaa, jatkoivat koodinmurtotekniikoiden soveltamista käsikirjoitukseen. Vaikka he tutkivat muita tekstejä ja heidät palkattiin murtamaan viestejä molempien maailmansotien aikana, he eivät koskaan päässeet Voynichin ratkaisun jäljille.
Tämän ensimmäisen maailmansodan aikana Friedmanit joutuivat suorittamaan laskelmansa käsin, mutta seuraavina vuosikymmeninä IBM:n reikäkortti-taulukointikoneet nopeuttivat prosessia huomattavasti. Työskennellessään Kansallisen turvallisuusviraston kanssa, kun se perustettiin 1950-luvulla, William ja muut koodinmurtajat jatkoivat kiinnostusta keskiaikaista käsikirjoitusta kohtaan (siitä on jopa kopio NSA:n sisäisessä kirjastossa). Koska käsikirjoitus oli salaamaton, kylmän sodan aikaiset koodinmurtajat saattoivat käyttää sitä havainnollistamaan kollegoilleen huippuluokan laskennallisia analyysitekniikoita ilman, että he käyttivät oikeita neuvostoviestejä.
Nykyaikainen Voynich-tutkimus nojaa myös vahvasti tietokoneanalyysiin, joskin paljon kehittyneemmillä työkaluilla. Lisa Fagin Davis, keskiajan tutkija, joka on seurannut Voynich-tutkimusta 1990-luvulta lähtien, sanoo, että ”laskentatehon uskomaton kehitys” on myös auttanut kumoamaan ehdotetut ratkaisut: ”Meillä on keino analysoida ja kritisoida julkaistuja ratkaisuja hienostuneella ja lähes kiistattomalla tavalla”, hän sanoo.
Mysteeriset kuvitukset ovat myös joidenkin tutkijoiden vetonaula. Kasvitieteilijä Arthur Tucker on vuodesta 2013 lähtien väittänyt, että Voynichin kasvit olivat kotoisin 1500-luvun Amerikasta. Hiljattain lähettämässään sähköpostiviestissä hän sanoi, että hänen ei-tietotekninen lähestymistapansa kunkin kasvitieteellisen kuvituksen tulkintaan herätti vihaa enemmän dataan keskittyneissä tutkijoissa, joiden menetelmät hän hylkäsi tarkentamatta ”ympäripyöreäksi päättelyksi”. Hänen teoriansa ei kuitenkaan ole saanut kasvitieteilijöiden eikä datatieteilijöiden suosiota.
”Laskentatehon uskomattomat edistysaskeleet” ovat olleet tämänhetkisen tutkimuksen suurin liikkeellepaneva voima, erityisesti kielianalyysin alalla, jossa outojen kirjoitusmerkkien digitaaliset transkriptiot mahdollistavat uusien algoritmien soveltamisen merkityksen purkuongelmaan.
Schinner sanoo, että muiden tiedemiesten yritykset vetivät hänet mukaan: ”Ehkä halusin vain selvittää, voisinko onnistua tätä paremmin.”
Käyttämällä matematiikasta ammennettua ja merkkijonoihin sovellettua ”satunnaiskävelykartoitusta” hän esitti vuonna 2007, että teksti on syntynyt taustalla olevan stokastisen prosessin – satunnaisuuden, kuten sadepisaroiden putoamisfrekvenssin – eikä luonnollisen kielen, jolla on rakennetta, perusteella. Toisessa artikkelissa, jonka hän oli mukana kirjoittamassa vuonna 2019, hän kehitti teoriaansa ja ehdotti tekstin mahdollista generointialgoritmia, joka on niin yksinkertainen, että keskiaikainen kirjuri olisi voinut tehdä sen huijauksena. Heidän tutkimuksensa näyttää tukevan ajatusta, että käsikirjoitus on merkityksetön.
Muut tuoreet tutkimukset ovat ristiriidassa Schinnerin johtopäätöksen kanssa. Tutkijaryhmä Brasiliassa ja Saksassa suoritti vuonna 2013 omat tilastolliset analyysinsä ja teki päinvastaisen johtopäätöksen: Teksti oli todennäköisesti kirjoitettu jollakin kielellä, eikä se ollut satunnaisesti luotu. Vuonna 2016 Albertan yliopiston tietojenkäsittelytieteilijä Greg Kondrak ja hänen oppilaansa Bradley Hauer käyttivät koneoppimisalgoritmia, joka oli koulutettu 380:llä saman tekstilohkon käännöksellä, ja ehdottivat, että sisältö on sekalaista hepreaa, joka on kirjoitettu oudolla käsikirjoituksella.
Turkkilainen insinööri ja hänen poikansa puolestaan esittävät teorian, jonka mukaan kirjoitus on keskiaikaisen turkkilaisen murteen foneettinen transkriptio, ja he suunnittelevat julkaisevansa tuloksistaan artikkelin vuonna 2020. Marraskuussa julkaistussa tilastotieteellisessä artikkelissa kuvataan, miten kirjainten visuaalinen analyysi tunnisti itse kirjoituksessa kuvioita, jotka näyttävät muistuttavan muita kirjoitettuja aakkosia.
”Jokainen haluaa olla se, joka todistaa sen, murtaa sen, todistaa omat kykynsä, todistaa olevansa fiksumpi”, keskiajan tutkija Davis sanoo. Yksi ongelma, hän lisää, etenkin monimutkaisen keskiaikaisen käsikirjoituksen kohdalla, on se, että tutkijat ovat asiantuntijoita. ”Tuskin kukaan ymmärtää käsikirjoituksen kaikkia eri osia”, hän huomauttaa viitaten kuvitusten lisäksi esimerkiksi sidontaan, musteisiin ja käsialaan. ”Siihen tarvitaan kokonainen poikkitieteellinen tiimi.”
Hän mainitsee Cheshiren kielianalyysistä syntyneen kiistan esimerkkinä tieteellisen julkaisemisen rajoista. Vaikka hänen artikkelinsa oli vertaisarvioitu – mikä on tavallisesti tieteellisen kurinalaisuuden kultainen standardi – arvioijat olivat todennäköisesti romaanisten kielten asiantuntijoita, koska artikkeli julkaistiin romaanitutkimuksen lehdessä. Vertaisarviointi on usein vaikeaselkoinen prosessi, jopa 600 vuotta vanhaa käsikirjoitusta vaikeaselkoisempien aiheiden kohdalla. Cheshire puolestaan luottaa työhönsä ja erottaa itsensä muista mahdollisista koodinmurtajista: Hän on oikeassa, ja he ovat väärässä. ”Todella yksinkertaista”, hän sanoo.
”Kaikki haluavat olla se, joka todistaa sen, murtaa sen, todistaa omat kykynsä, todistaa olevansa fiksumpi.”
Toisille Voynich-tutkijoille tärkeintä on se, mitä matkan varrella oppii. Viimeisten viiden vuoden aikana laskennallisen kielitieteen, fysiikan, tietojenkäsittelytieteen ja kryptologian alaan kuuluvissa lehdissä on julkaistu Voynich-papereita, joista osa on myöhemmin kumottu, mutta monissa muissa on pikemminkin hahmoteltu uutta lähestymistapaa tekstin analysointiin kuin esitetty lopullisia väitteitä ratkaisusta. Jälkimmäisissä tapauksissa tavoitteena voi olla ensisijaisesti uusien työkalujen esittely, joita voidaan soveltaa muilla aloilla.
Tekoälyalgoritmit esimerkiksi vaativat usein suuria tietokokonaisuuksia harjoittelua ja testausta varten, ennen kuin niitä voidaan soveltaa laajalti, ja Voynichin käsikirjoituksen analyysi voi auttaa fyysikoita ja muita tiedemiehiä testaamaan, pystyvätkö uudet numeronmurskausmenetelmät tunnistamaan mielekkäitä kuvioita valtavista abstrakteista datamääristä.
Vuonna 2013 julkaistussa brasilialaisessa fysiikan artikkelissa käytettiin Voynichin käsikirjoitusta havainnollistamaan, miten tilastollisen fysiikan menetelmiä voidaan sovittaa piilotettujen kielellisten kuvioiden löytämiseen, ja päädyttiin siihen johtopäätökseen, että teksti ei vaikuttanut satunnaisesti syntyneeltä. Ja Kondrakin ja Hauerin koneoppimista käsittelevä artikkeli keskittyi pääasiassa kuvaamaan kielianalyysialgoritmeja, joita he käyttivät havaitakseen heprean taustalla olevaksi kieleksi. Vaikka kumpaakaan teoriaa ei ole hyväksytty Voynichin ratkaisuksi, ne voivat silti osoittautua tehokkaiksi muilla areenoilla.
Kuten Schinner sanoo: ”Koskaan ei voi tietää, mitä tapahtuu, kun soveltaa tätä tai tuota menetelmää”, sillä käsikirjoituksen sisältö on edelleen tuntematon. Se, mitä tutkijat oppivat kokeilemalla ja erehtymällä, voi auttaa heitä ”kehittämään tekniikoita, joita voidaan myöhemmin käyttää käytännön ongelmiin”, Kondrak sanoo.
Loppujen lopuksi käsikirjoitus saattaa yksinkertaisesti olla ratkaisematon arvoitus. Chicagon yliopiston tieteenhistorioitsija Robert Richards käyttää koodeksia opettamaan tieteellisten paradigmojen käsitettä, jossa tieteellinen teoria tulee muokkaamaan tutkimusalaa niin vahvasti, että tutkijat eivät aina pysty selittämään tai tunnistamaan teorian ulkopuolisia poikkeamia.
Richards vertaa Voynichin tekstiä vuonna 2016 ilmestyneessä elokuvassa Arrival (Saapuminen) Maahan laskeutuvien avaruusolentojen käyttämään käsittämätöntä kieltä: Emme ole edes varmoja, onko se oikeastaan lainkaan kieltä, koska se on niin kaukana kielellisen paradigmamme ulkopuolella. Vaikka se näyttääkin tarkoittavan jotain, hän sanoo: ”Voisimme olla siitä varmoja vain, jos voisimme kääntää sen kielellemme.”
Kuka tietää, hän sanoo Voynichin käsikirjoituksesta: ”
Jillian Foley on jatko-opiskelija Chicagon yliopistossa, jossa hän tutkii kryptografian ja tietojenkäsittelytieteen historiaa. Hänen töitään on ilmestynyt Slate- ja Technology’s Stories -lehdissä.