É um mistério com aproximadamente 600 anos de idade que continua a empatar estudiosos, criptógrafos, físicos e cientistas da computação: um códice medieval de aproximadamente 240 páginas escrito em uma linguagem indecifrável, repleto de desenhos bizarros de plantas esotéricas, mulheres nuas, e símbolos astrológicos. Conhecido como o manuscrito Voynich, ele desafia a classificação, muito menos a compreensão.
E, no entanto, ao longo dos anos, um fluxo constante de pesquisadores tem se intensificado com novas alegações de ter descoberto seus segredos. Ainda no verão passado, um antropólogo do Foothill College na Califórnia declarou que o texto era um “dialeto latino vulgar” escrito em um obscuro estandarte romano. E no início do ano, Gerard Cheshire, um acadêmico da Universidade de Bristol, publicou um artigo revisado por colegas na revista Romance Studies argumentando que o roteiro é uma mistura de línguas que ele chamou de “proto-Romance”
alguns caçadores Voynich acreditam que a busca pode ser “puro veneno” para uma carreira acadêmica inexperiente, porque ao estudar o manuscrito há “sempre uma opção fácil de cometer um erro ridículo”.”
Isso, porém, até agora, toda reivindicação de uma solução Voynich – incluindo ambas do ano passado – tem sido ignorada ou desmascarada por outros especialistas, veículos de mídia e obsessivos Voynich. No caso de Cheshire, a Universidade de Bristol retirou um comunicado de imprensa destacando seu trabalho depois que outros especialistas desafiaram redondamente sua pesquisa.
Físico Andreas Schinner relatou um rumor de que o manuscrito de Voynich pode ser “puro veneno” para uma carreira acadêmica, porque ao estudar o manuscrito há “sempre uma opção fácil de cometer um erro ridículo”.”
“O mundo acadêmico é uma selva”, Schinner, que aplicou pela primeira vez a análise estatística ao manuscrito há mais de uma década, escreveu em um e-mail, “e como em qualquer selva, não é recomendado mostrar até mesmo uma fraqueza potencial”, “
Tudo o que sabemos com certeza, através de testes forenses, é que o manuscrito provavelmente data do século XV, quando os livros eram feitos à mão e raros”. Mas sua proveniência e significado são incertos, tornando virtualmente impossível corroborar qualquer afirmação sobre seu conteúdo contra outros materiais históricos.
Então por que tantos estudiosos e cientistas são levados a resolver o quebra-cabeça? Para muitos, é a derradeira oportunidade de provar suas habilidades analíticas em seus campos dados. Para outros, é a chance de testar novas tecnologias digitais promissoras e avanços da inteligência artificial. E para alguns, é simplesmente a emoção da caçada.
O manuscrito foi adquirido em 1912 por Wilfrid Voynich, um vendedor de livros raros polaco. Mais parecido com um livro moderno do que com um pergaminho, ele está cheio de textos escritos à mão em loop, escritos em um roteiro elaborado, acompanhados de ilustrações luxuosas. O achado não conseguiu enriquecer Voynich, mas o manuscrito continuou a fazer manchetes por mais de cem anos, desafiando pesquisadores em muitas áreas, incluindo lingüística, botânica e aprendizagem de máquinas. Ele agora reside na Biblioteca Beinecke da Universidade de Yale.
No início, ele atraía principalmente estudiosos de humanidades. Em 1921, William Newbold, um filósofo da Universidade da Pensilvânia que tinha interesse em criptografia, alegou que um frade do século XIII o escreveu como um tratado científico. Newbold acreditava que cada letra arcana era na verdade uma coleção de símbolos minúsculos legíveis sob ampliação adequada, o que teria significado que o microscópio foi inventado séculos antes de nós pensarmos. Após a morte de Newbold, John Manly, um professor de literatura americano e colega quebra-códigos, desmentiu a teoria de Newbold, mostrando que seus métodos eram arbitrários e cientificamente pouco confiáveis.
William e Elizebeth Friedman, duas figuras fundadoras da quebra de cifras moderna, continuaram a aplicar técnicas de quebra de códigos ao manuscrito. Embora estudassem outros textos e fossem recrutados para quebrar mensagens durante as duas guerras mundiais, nunca conseguiram chegar a uma solução para o Voynich.
Durante a Primeira Guerra Mundial, os Friedmans tiveram de fazer os seus cálculos à mão, mas nas décadas seguintes, as máquinas de tabulação de cartão perfurado da IBM tornaram o processo muito mais rápido. Trabalhando com a Agência Nacional de Segurança quando ela foi formada na década de 1950, William e outros quebra-códigos buscaram um interesse no manuscrito medieval (há até mesmo uma cópia dele na biblioteca interna da NSA). Como o manuscrito não estava classificado, os quebra-códigos da Guerra Fria podiam usá-lo para ilustrar técnicas de análise computacional de ponta para seus colegas sem usar mensagens soviéticas reais.
A pesquisa recente de Voynich também depende muito da análise computacional, embora com ferramentas muito mais sofisticadas. Lisa Fagin Davis, uma estudiosa medieval que tem seguido a pesquisa de Voynich desde os anos 90, diz que os “incríveis avanços no poder computacional” também ajudaram a debunk a propor soluções: “Temos uma maneira de analisar e criticar soluções que são publicadas de forma sofisticada e quase indiscutível”, diz ela.
As ilustrações misteriosas também são um desenho para alguns pesquisadores. O botânico Arthur Tucker afirma desde 2013 que as plantas Voynich eram nativas das Américas do século 16. Em um e-mail recente, ele disse que sua abordagem não computacional interpretando cada uma das ilustrações botânicas despertou a raiva de cientistas mais focados em dados, cujos métodos ele descartou, sem elaboração, como “raciocínio circular”. Mas sua teoria não pegou nem botânicos nem cientistas de dados.
“Incríveis avanços no poder computacional” têm sido o maior impulsionador da pesquisa atual, especialmente na análise lingüística, onde transcrições digitais do estranho script tornam viável a aplicação de novos algoritmos ao problema de decodificar seu significado.
Como para Schinner, ele diz ter sido atraído pelas tentativas de outros cientistas: “Talvez eu só quisesse descobrir se poderia fazer melhor do que isto.”
Usando o “mapeamento de caminhadas aleatórias” extraído da matemática e aplicado a cordas de caracteres, ele sugeriu em 2007 que o texto foi gerado a partir de um processo estocástico subjacente – aleatoriedade como a frequência de gotas de chuva – e não uma linguagem natural, que tem estrutura. Um segundo trabalho que ele co-autorizou em 2019 elaborou sobre sua teoria para propor um possível algoritmo de geração para o texto, simples o suficiente para que um escriba medieval o pudesse ter feito como um embuste. Suas pesquisas parecem apoiar a idéia de que o manuscrito não tem sentido.
Outros estudos recentes contradizem a conclusão de Schinner. Uma equipe de cientistas no Brasil e na Alemanha em 2013 realizou suas próprias análises estatísticas e tirou a conclusão oposta: O texto foi provavelmente escrito em uma linguagem, e não aleatoriamente gerado. Em 2016, Greg Kondrak, um cientista da Universidade de Alberta, e seu aluno, Bradley Hauer, implantaram um algoritmo de aprendizado de máquina treinado em 380 traduções do mesmo bloco de texto para propor que o conteúdo fosse em hebraico misturado, escrito em um script estranho.
Um engenheiro turco e seu filho, enquanto isso, teorizam que o script é uma transcrição fonética de um dialeto turco medieval e planejam publicar um artigo sobre suas descobertas em 2020. E um artigo de estatística publicado em novembro descreveu como a análise visual das letras identificadas padrões no próprio script que parecem semelhantes a outros alfabetos escritos.
“Todos querem ser aqueles que provam isso, quebrar, provar suas próprias habilidades, provar que você é mais esperto”, diz Davis, o estudioso medieval. Um problema, acrescenta ela, especialmente com um manuscrito medieval complexo, é que os pesquisadores são especialistas. “Quase ninguém lá fora entende todos os diferentes componentes” do manuscrito, ela aponta, referindo-se não apenas às ilustrações, mas a coisas como a encadernação, as tintas e a caligrafia. “Vai ser preciso toda uma equipe interdisciplinar”
Cita a controvérsia sobre a análise linguística de Cheshire como um exemplo dos limites da publicação académica. Embora seu trabalho tenha sido revisado por pares – normalmente o padrão ouro do rigor acadêmico – os revisores eram muito provavelmente especialistas em línguas românicas, uma vez que o trabalho foi publicado em uma revista de Estudos Românticos. E a revisão por pares é um processo frequentemente opaco, mesmo para tópicos muito menos obscuros do que um manuscrito de 600 anos. Por sua vez, Cheshire continua confiante no seu trabalho, fazendo uma distinção entre ele próprio e os outros aspirantes a crackers a código: Ele está certo, e eles estão errados. “Simples, realmente”, diz ele.
“Todos querem ser aqueles que o provam, que o quebram, que provam suas próprias habilidades, que provam que você é mais esperto”.
Para outros pesquisadores Voynich, o ponto principal é o que você aprende ao longo do caminho. Nos últimos cinco anos, revistas cobrindo lingüística computacional, física, informática e criptologia têm publicado artigos de Voynich, alguns mais tarde desmascarados, mas muitos outros delineando uma nova abordagem para analisar o texto em vez de fazer uma reivindicação definitiva de uma solução. Nos últimos casos, o objetivo pode ser principalmente mostrar novas ferramentas que podem ser aplicáveis a outros campos.
Artificial intelligence algorithms, por exemplo, freqüentemente requerem grandes conjuntos de dados para treinamento e testes antes que possam ser amplamente aplicados, e a análise do manuscrito de Voynich pode ajudar os físicos e outros cientistas a testar se novos métodos de contagem de números podem identificar padrões significativos em grandes quantidades de dados abstratos.
O artigo de física brasileira de 2013 utilizou o manuscrito Voynich para ilustrar como métodos estatísticos de física podem ser adaptados para encontrar padrões linguísticos ocultos e concluiu que o texto não parecia gerado aleatoriamente. E o trabalho de Kondrak e Hauer focou principalmente na descrição dos algoritmos de análise de linguagem que eles usaram para detectar o hebraico como a língua subjacente. Mesmo que nenhuma teoria tenha sido aceita como uma solução Voynich, eles ainda podem se mostrar eficazes em outras arenas.
Como Schinner diz, “Você nunca sabe o que acontecerá quando aplicar este ou aquele método”, já que o conteúdo do manuscrito permanece desconhecido. O que quer que os pesquisadores aprendam através de tentativas e erros pode ajudá-los a “desenvolver técnicas que mais tarde possam ser usadas em problemas práticos”, diz Kondrak.
No final, o manuscrito pode ser simplesmente um mistério insolúvel. Robert Richards, historiador da ciência na Universidade de Chicago, usa o códice para ensinar o conceito de paradigmas científicos, onde uma teoria científica vem moldar um campo de pesquisa tão fortemente que os cientistas nem sempre conseguem explicar ou identificar anomalias fora da teoria.
Richards compara o texto de Voynich à linguagem inescrutável usada por alienígenas que aterrissam na Terra no filme “Arrival”, em 2016: Nem sequer temos a certeza se é realmente uma linguagem, já que está tão fora do nosso paradigma linguístico. Embora pareça significar algo, ele diz: “Só podemos ter certeza disso se conseguirmos traduzi-lo para a nossa língua”
Quem sabe, ele diz do manuscrito de Voynich: “Pode ser, afinal, apenas uma piada medieval sem sentido.”‘
Jillian Foley é uma estudante de pós-graduação na Universidade de Chicago, onde estuda a história da criptografia e da informática. Seu trabalho tem aparecido em Slate and Technology’s Stories.