Formação simultânea de produtos de glicosilação
A formação de estruturas de nucleósidos e nucleotídeos de precursores simples foi alcançada simultaneamente com três nucleobases por reações de desidratação. Isto contrasta com trabalhos anteriores neste campo, onde as condições foram otimizadas para favorecer produtos específicos24,25,26. Numa experiência típica de glicosilação, adenina e P-ribose foram aquecidas a 90 °C durante 5 h a pH 2,5. Observou-se a formação do nucleotídeo adenina monofosfato (AMP) (e seus isômeros) quando adenina e P-ribose foram combinados. Os cromatogramas de íons extraídos (EICs) obtidos a partir da análise HPLC-MS dos produtos revelaram vários picos com correspondência m/z + e + (Figuras Suplementares. 13-15). A comparação com padrões confirmou que o AMP corresponde ao pico encontrado em RT = 4,2 min (Figs. 5, 6 Suplementares); outros picos principais podem ser consistentes com isômeros AMP, como o isômero N6-ribosilado. Para confirmar isso, foi realizada uma reação de hidrólise na presença de NaOH (0,1 M), na tentativa de diferenciar os diferentes isômeros, considerando que o isômero N6-ribosilado é mais propenso à hidrólise. Entretanto, pode-se observar um leve distúrbio nos picos, o que dificulta a confirmação da identidade do isômero N6-ribosilado. Em seguida, analisamos dois padrões puros de dois isómeros diferentes (adenosina 3′- monofosfato e adenosina 5′-monofosfato monohidratado) individualmente e em mistura, a fim de elucidar o perfil de eluição dos isómeros (Figs. 148, 149 suplementares). Uma mudança no tempo de retenção pode ser observada para a mistura padrão fornecendo uma melhor correlação com a eluição destes compostos na amostra real. Embora seja difícil diferenciar os isômeros, podemos confirmar a presença de pelo menos dois isômeros dentro dos produtos AMP comparando o perfil de eluição da mistura padrão com a amostra real. Agora fica claro que a formação de diferentes isômeros (Figura Complementar 12) é um possível motivo para eluir nucleotídeos com as mesmas massas em diferentes tempos de retenção. Além disso, a análise MS/MS de nossos produtos de reação revela fragmentação da AMP (e seus isômeros) em adenina (m/z = 136,0617 ± 0,01) (Suplemento Fig. 20); isto é consistente com a fragmentação do padrão canônico da AMP. Nosso mecanismo de reação proposto consiste na formação de uma ligação glicosídica entre um grupo de ribose 1′-OH e um aminogrupo de adenina (ver Suplemento Fig. 12).
Reações de tempo-curso mostram que a evaporação da água é a principal força motriz para a formação de produtos de glicosilação, mostrando um aumento significativo na formação de estruturas de nucleósidos e nucleotídeos no período de 2 a 4 h (Fig. 2a). Isto corresponde ao intervalo de tempo quando o volume da amostra é drasticamente reduzido, e os reagentes são extremamente concentrados. Após 5-6 h de reação, a amostra atinge a secura e a taxa de reação (seguida da intensidade nas medidas de HPLC-MS) se estabiliza. Além da AMP, produtos contendo ligações glicosídicas, incluindo nucleotídeos cíclicos (i.e. cAMP)27, e nucleósidos (i.e. adenosina), foram detectados usando RP-HPLC-MS, MS/MS, e testados para formação de 1,N6-etheno derivado28,29, confirmado por comparação com os padrões (Fig. 2, Suplemento Figs. 7-11, Suplemento Figs. 23-27). Os tempos de retenção das normas canônicas 2′,3′-cAMP e 3′,5′-cAMP não corresponderam aos tempos de retenção dos picos do EIC na amostra. Entretanto, as distribuições de massa (+; +) e os padrões de fragmentação (+) foram idênticos (Figs. 16-21 Suplementares). Estes resultados mostram que enquanto as estruturas cíclicas são formadas, o AMPc canônico não é o produto principal. A comparação com um padrão analítico de adenosina também mostra que a adenosina, juntamente com um número de espécies isoméricas, é formada na reação de condensação de P-ribose e adenina (Figs. 18-22 Suplementares). Enquanto as formas canônicas de AMP e adenosina foram confirmadas nestes experimentos, elas não foram os principais produtos na reação de desidratação.
Quando o fosfato foi fornecido separadamente como pirofosfato e reagiu com adenina e ribose, um composto com a massa de adenosina foi detectado e uma baixa quantidade de AMP e cAMP foi detectada, e adenosina ainda se formou quando nenhuma fonte de fosfato estava presente (Figuras Suplementares. 33-41). Vale ressaltar que focalizamos intencionalmente nossos estudos na identificação de produtos fosforados (isômeros AMP e isômeros cAMP) e prestamos menos atenção na identificação de produtos fosforados que não sejam isômeros AMP e isômeros cAMP30,31,32. Propomos a formação de uma ligação glicosídica entre o grupo hidroxila da ribose e um grupo amino da adenina, que é desencadeada pela perda de uma molécula de água por evaporação. A reatividade relativa dos grupos amina primária e secundária da adenina é bem estudada33 e sem ativação ou a presença de um grupo protetor, a ligação glicosídica na amina primária é normalmente preferida. Portanto, não se espera que o isômero canônico da adenosina/AMP seja um produto importante, pois exigiria reação exclusivamente na amina secundária. No entanto, a reatividade é suficientemente alta no local da amina secundária para que os isômeros canônicos sejam formados, embora não como o produto principal. Em outras nucleobases, como a guanina, existem grupos de aminas ainda mais acessíveis, e o potencial para produtos isoméricos é maior. É provável que a reactividade da ribose seja predominantemente através da posição anomérica, levando a menos isómeros possíveis, embora alguns outros produtos menores possam ser observados.
A reactividade de outras nucleobases canónicas (citosina, guanina e timina) com P-ribose também foi investigada. Massas correspondentes a estruturas nucleósidas e nucleotídicas foram detectadas após a reação de desidratação da guanina e citosina com P-ribose (Fig. 3 e Figs. 50-64 Suplementares). As estruturas de glicosilação da guanina foram formadas em uma extensão relativamente baixa, provavelmente devido à solubilidade limitada da guanina em pH baixo. As quantidades de produto medidas para 5-metiluridina monofosfato (m5UMP) e 5-metiluridina (timina nucleósido) foram ainda mais baixas que as suas equivalentes de guanina e citosina (Fig. 3 e Figs. 65, 66 Suplementares). Estes resultados podem ser explicados pela presença de um grupo amino primário na guanina e na citosina, que está ausente na timina. Enquanto as três nucleobases têm grupos secundários de aminas, estes são menos reactivos na formação de ligações glicosídicas. Portanto, a formação de estruturas nucleósidas e nucleotídicas através de uma reação de amina secundária, como é necessário para formar produtos de glicosilação canônica, é desfavorecida nas nucleobases onde as aminas primárias estão disponíveis. Isto tem uma implicação interessante para a adopção da química do ácido nucleico na origem da vida, uma vez que sugere que os nucleótidos canónicos podem ter sido inicialmente inadequados até ao surgimento de mais maquinaria bioquímica para aumentar a selectividade em direcção aos isómeros correctos. Portanto, como esperado, enquanto os nucleotídeos canônicos e produtos nucleósidos de citosina e guanina foram formados em nossas experiências, eles não corresponderam aos picos principais observados (Figuras Suplementares. 42-49). Combinando estas duas observações (tempos de retenção diferentes mas a mesma distribuição de massa que os padrões canónicos nos EIC), podemos concluir que as espécies de nucleótidos e nucleosídeos formados a partir da reacção de desidratação da guanina/citosina com P-ribose foram principalmente espécies isoméricas dos nucleótidos e nucleósidos canónicos (algumas estruturas possíveis são mostradas em Figs Suplementares. 50, 51).
Tipicamente, a formação de estruturas nucleotídicas foi realizada sob condições específicas dependendo da nucleobase utilizada, visando um produto de reação específico. Numa abordagem alternativa, decidimos incluir várias nucleobases simultaneamente na reacção com P-ribose. Nosso objetivo era determinar se a formação de produtos com múltiplas nucleobases sob as mesmas condições de reação produziria uma mistura de produtos, ou seria dominada por um. Esta reação foi realizada incluindo duas ou três nucleobases (adenina, guanina e citosina) simultaneamente no vaso de reação, junto com a P-ribose. Uma mistura de produtos de glicosilação foi obtida, incluindo nucleotídeos (AMP, GMP e CMP), bem como os respectivos nucleotídeos cíclicos (cAMP, cGMP e cCMP) e produtos nucleósidos (adenosina, guanosina e ctidina) (Figs. 67-95 suplementares). Os produtos de glicosilação da guanina foram formados em um rendimento menor que os da adenina e citosina, como esperado devido à baixa solubilidade da guanina sob condições ácidas.
Intercâmbio de nucleobase
Intercâmbio de nucleobase foi observado quando Na+AMP foi aquecido por 5 h a 90 °C em meio aquoso ácido com citosina ou guanina. A troca de nucleobase resultou na formação de estruturas de nucleotídeos (CMP ou GMP), nucleotídeos cíclicos (cCMP ou cGMP) e estruturas de nucleósidos (ctidina ou guanosina) (ver Figuras Suplementares 96-102, e Tabela Suplementar 1 para rendimentos semi-quantitativos). Neste experimento, o CMP e a ctidina mostraram uma tendência crescente em intensidade, enquanto o cCMP atingiu uma intensidade máxima quando era de 12,5 mM e depois caiu até uma intensidade de 4,0 × 104 AU (Figuras Suplementares 102a e 155-158). Com uma concentração de citosina de 37,5 mM, o composto com maior intensidade foi encontrado como CMP e as intensidades medidas para cCMP e ctidina foram quase as mesmas. Duas espécies isoméricas principais foram observadas nos EICs do CMP e do cCMP. Foram detectadas +, + e + massas no caso do CMP, enquanto o cCMP mostrou +, + e + dentro de suas respectivas distribuições de massa. No caso da ctidina, + foi o pico principal detectado. Estas distribuições de massa coincidiram com as observadas nos padrões. Entretanto, o tempo de retenção dos isômeros principais não correspondeu ao CMP canônico e à ctidina. Quando a AMP reagiu com concentrações crescentes de guanina (Fig. Complementar 102b), os três produtos de glicosilação (GMP, cGMP e guanosina) atingiram um valor máximo quando a concentração de guanina foi de 2,5 mM (Fig. Complementar. 160-162). Estes resultados foram consequência da solubilidade limitada da guanina em pH ácido, portanto, mesmo que mais guanina fosse adicionada ao vaso de reação, a concentração efetiva na solução era a mesma. Seguindo o valor máximo, a intensidade do GMPc e da guanosina foram constantes, devido à fraca solubilidade da guanina. Apenas um pequeno aumento na intensidade dos três produtos de glicosilação da guanina foi observado quando = 37,5 mM, o que pode estar relacionado a uma maior presença de guanina na solução, devido à alta concentração adicionada. No EIC de GMP, foi observada uma ampla área sem picos bem definidos, embora dois picos principais tenham se destacado. + foi a única espécie química, relacionada aos compostos de guanina, detectada na distribuição de massa no seu EIC. Quatro picos, agrupados em pares, foram observados quando o EIC do GMPc foi extraído dos dados do EM e a distribuição de massa mostrou + e + espécies. Por outro lado, o EIC da guanosina apresentou três picos, o mais intenso dos quais mostrou a presença de + na sua distribuição de massa.
A formação de citosina e produtos de glicosilação da guanina demonstrou que a clivagem da ligação glicosídica do AMP ocorreu sob as nossas condições de reação. Quando os EICs de AMP, cAMP e adenosina foram analisados, vários picos foram observados em cada cromatograma, apoiando a teoria de que as ligações glicosídicas sofrem hidrólise/formação dinâmica durante a reação de desidratação34. As reações de citosina e nucleotídeos de guanina com adenina também foram investigadas. No caso da reação de desidratação de CMP e adenina, nenhum produto correspondente à troca de nucleobase pôde ser observado (Fig. Suplementares 103-108/a). Entretanto, produtos de glicosilação da adenina foram claramente detectados na reação de GMP com adenina (Figs. 105-108/b Suplementares). Isto porque a hidrólise das ligações glicosídicas em GMP é mais fácil do que para CMP, sob as mesmas condições de reação34. Também realizamos a reação de troca da nucleobase com UMP e adenina, a fim de comparar com o análogo direto da pirimidina (Fig. 109 Suplementar). Os resultados foram mais similares aos rendimentos de CMP mostrados na Figura Complementar 108, do que com os rendimentos de GMP, obtendo um rendimento muito baixo para os produtos de glicosilação da adenina na reação UMP que não é suficiente para permitir a detecção de AMP e cAMP.
Efeito dos aminoácidos na distribuição dos produtos de glicosilação
Como mencionado anteriormente, os aminoácidos, nucleotídeos e seus blocos de construção poderiam ter estado presentes na Terra precoce ao mesmo tempo. Portanto, produtos de uma reação de co-polimerização, ou mesmo produtos resultantes de algum efeito catalítico de um tipo de polímero sobre o outro, poderiam ter ocorrido sob um ambiente prebiótico. Para estudar a co-reactividade de blocos de construção de nucleótidos e aminoácidos em uma desidratação de um ponto, a glicina, o aminoácido mais simples, foi incluída nas reacções de desidratação de P-ribose e respectivas nucleobases. A incorporação da glicina teve um efeito claro na formação dos produtos de glicosilação, fazendo com que o rendimento global dos produtos com a massa de isômeros AMP, isômeros cAMP e adenosina (Fig. 4a e Figs. 28-32 Suplementares) diminuísse. Isto indica que a glicina tem um papel importante no consumo de blocos de construção de nucleotídeos (P-ribose e/ou adenina) através de uma reação lateral, ou que ela se apega à estrutura do produto, alterando sua massa. A análise EIC para estas reacções revela picos correspondentes à massa de adutos de glicina (ou seja, AMP-Gly, cAMP-Gly, adenosine-Gly e adenine-Gly) (Figs suplementares. 115-122), embora estes produtos secundários não sejam formados em quantidade suficiente para responder a todas as alterações observadas. Os adutos de glicina também foram confirmados pelo uso de glicina deuterada como material de base juntamente com P-ribose e adenina, o que causou alterações na distribuição isotópica das massas do aduto (Figs. 123, 124). Um rendimento semi-quantitativo máximo de 59% foi obtido para a formação de produtos de glicosilação (isômeros AMP, isômeros cíclicos AMP e adenosina) na reação de P-ribose e adenina; entretanto, apenas 46% de rendimento foi obtido quando a glicina também estava presente no meio de reação (Fig. 144 Suplementar). A quantificação dos rendimentos para todos os isómeros individuais possíveis é tecnicamente difícil, mas os rendimentos semi-quantitativos de alguns isómeros poderiam ser determinados utilizando padrões puros: Adenosina 5′-monofosfato e adenosina 2′,3′- monofosfato cíclico foram encontrados em 38,7% e 18,2%, respectivamente, na ausência de glicina, enquanto o rendimento na presença de glicina foi significativamente reduzido (<2%) para ambos os isômeros.
Glycine também afetou a distribuição das espécies isoméricas, e diferenças claras foram observadas em comparação ao cromatograma de pico de base (BPC) da reação de P-ribose e adenina, na presença e ausência de glicina (Fig. 4b e Figs. Complementares. 110-114). Esses dados indicaram a presença de diferentes espécies químicas e uma consequente mudança na distribuição de massa entre as reações com e sem glicina. Os EICs individuais foram então analisados para cada produto de glicosilação da adenina, resultando em diferenças claras sendo observadas nas intensidades relativas de pico quando a glicina foi adicionada. Estes resultados mostram claramente que a glicina tem um efeito selectivo em que as espécies isoméricas são preferencialmente formadas. Sabe-se que a glicina reage rapidamente com outras aminas em condições de desidratação12, sendo provável que reaja com as aminas primárias das nucleobases. Produtos secundários híbridos incluindo glicina (Gly-AMP, Gly-cAMP, Gly-Adenosine, Gly-Adenine) foram detectados em ~1% de rendimento (Fig. Complementar 145), contudo, esta pequena percentagem tem um efeito importante na distribuição isomérica dos produtos de glicosilação da adenina (ver Fig. Complementar 146, 147). Alteração na distribuição isotópica das massas de produtos híbridos foi detectada (Fig. 123, 124 Suplemento) quando a glicina deuterada foi incluída na reação de desidratação, confirmando a inclusão da glicina em estruturas híbridas.
Um efeito semelhante na distribuição de isômeros também foi observado quando a P-ribose foi reagida com citosina/guanina na presença de glicina (Fig. 4c, Suplemento 125-140). As intensidades máximas das diferentes espécies de isômeros diminuíram (GMP, CMP, cGMP, cCMP, guanosina e ctidina), enquanto a distribuição das intensidades relativas também foi afetada. As diferenças entre os experimentos foram rigorosamente verificadas utilizando um método estatístico como a análise de agrupamento de dados do EIC para segmentar amostras, na presença e ausência de glicina, em grupos/clientes constituintes com características comuns (Fig. 5). O objetivo da análise de agrupamento neste estudo é agrupar dados (ou seja, formação de nucleotídeos e estrutura de nucleósidos) em conjuntos constituintes com características comuns (por exemplo, adição de glicina versus ausência de glicina). Esta análise deve demonstrar uma elevada homogeneidade interna dentro dos agregados/grupos e uma elevada heterogeneidade externa entre os agregados/grupos. A figura 5 mostra um dendrograma com a ligação “Wards “35. Para identificar clusters no dendrograma, colorimos os espectros de acordo com a presença de glicina (glicina – vermelha, sem glicina – preta, em branco – azul). Como pode ser observado, a glicina contendo amostras se aglomeram juntas. Um aglomerado corresponde a P-ribose + adenina + glicina (três amostras), que é separado das amostras sem glicina. Um segundo grupo corresponde a P-ribose + guanina + glicina e P-ribose + citosina + glicina. As amostras contendo adenina se separam em um aglomerado maior que se distingue das outras amostras, indicando uma forte influência da adenina na reação. De fato, há uma série de outros possíveis produtos e reações que podem ocorrer sob as condições da reação conduzida (ver Nota Complementar 1 e Fig. Complementar. 150-162 para mais detalhes).
Outros aminoácidos também foram incluídos na reação de desidratação da adenina com P-ribose para testar se eles também teriam algum efeito na distribuição isomérica dos produtos de glicosilação (Figuras Suplementares. 141-143). Os seis aminoácidos seleccionados para este estudo (arginina, ácido glutâmico, treonina, metionina, fenilalanina e triptofano) têm diferentes cadeias laterais, com diferentes naturezas químicas e grupos funcionais. Quando os resultados foram comparados com os dados obtidos a partir da reação de apenas P-ribose e adenina, foram observadas mudanças na distribuição isomérica da AMP em todas as reações, exceto no caso do triptofano, que podem ser atribuídas a limitações conformacionais devido à presença da cadeia lateral baseada no interior do triptofano. Analisando os AMP EICs cAMP, foram observadas pequenas alterações na intensidade relativa dos picos isoméricos. Entretanto, uma diferença clara foi observada no EIC da adenosina apenas para as reações incluindo fenilalanina e treonina.