Formación simultánea de productos de glicosilación
La formación de estructuras de nucleósidos y nucleótidos a partir de precursores simples se logró simultáneamente con tres nucleobases mediante reacciones de deshidratación. Esto contrasta con trabajos anteriores en este campo, en los que se optimizaron las condiciones para favorecer productos específicos24,25,26. En un experimento típico de glicosilación, la adenina y la P-ribosa se calentaron a 90 °C durante 5 h a pH 2,5. Observamos la formación del nucleótido monofosfato de adenina (AMP) (y sus isómeros) cuando se combinaron la adenina y la P-ribosa. Los cromatogramas de iones extraídos (EIC) obtenidos del análisis HPLC-MS de los productos revelaron varios picos con m/z coincidentes + y + (Figs. Suplementarias 13-15). La comparación con los estándares confirmó que el AMP corresponde al pico encontrado a RT = 4,2 min (Figs. Suplementarias 5, 6); otros picos principales podrían corresponder a isómeros del AMP, como el isómero N6-ribosilado. Para confirmarlo, se realizó una reacción de hidrólisis en presencia de NaOH (0,1 M), en un intento de diferenciar los distintos isómeros, considerando que el isómero N6-ribosilado es más propenso a la hidrólisis. Sin embargo, se observa una ligera alteración en los picos, lo que dificulta la confirmación de la identidad del isómero N6-ribosilado. A continuación, analizamos dos estándares puros de dos isómeros diferentes (adenosina 3′-monofosfato y adenosina 5′-monofosfato monohidratado) individualmente y en una mezcla para dilucidar el perfil de elución de los isómeros (Figs. 148, 149 suplementarias). Se puede observar un cambio en el tiempo de retención para la mezcla estándar que proporciona una mejor correlación con la elución de estos compuestos en la muestra real. Aunque es difícil diferenciar los isómeros, podemos confirmar la presencia de al menos dos isómeros dentro de los productos AMP comparando el perfil de elución de la mezcla estándar con la muestra real. Ahora está claro que la formación de diferentes isómeros (Fig. 12 suplementaria) es una posible razón para la elución de nucleótidos con las mismas masas en diferentes tiempos de retención. Además, el análisis MS/MS de nuestros productos de reacción revela la fragmentación del AMP (y sus isómeros) en adenina (m/z = 136,0617 ± 0,01) (Fig. Suplementaria 20); esto es consistente con la fragmentación del estándar canónico de AMP. Nuestro mecanismo de reacción propuesto consiste en la formación de un enlace glicosídico entre un grupo 1′-OH de la ribosa y un grupo amino de la adenina (véase la Fig. suplementaria 12).
Las reacciones de curso temporal muestran que la evaporación del agua es la principal fuerza motriz para la formación de productos de glicosilación, mostrando un aumento significativo en la formación de estructuras de nucleósidos y nucleótidos en el período de tiempo entre 2 y 4 h (Fig. 2a). Esto corresponde al intervalo de tiempo en el que el volumen de la muestra disminuye drásticamente y los reactivos están extremadamente concentrados. Tras 5-6 h de reacción, la muestra alcanza la sequedad y la velocidad de reacción (seguida de la intensidad en las mediciones de HPLC-MS) se estabiliza. Además del AMP, los productos que contienen enlaces glicosídicos, incluidos los nucleótidos cíclicos (es decir, el AMPc)27, y los nucleósidos (es decir, la adenosina), se detectaron mediante RP-HPLC-MS, MS/MS, y se comprobó la formación de derivados de 1,N6-eteno28,29, confirmada por comparación con los estándares (Fig. 2, Figs. suplementarias 7-11, Figs. suplementarias 23-27). Los tiempos de retención de los estándares canónicos 2′,3′-cAMP y 3′,5′-cAMP no se correspondieron con los tiempos de retención de los picos de EIC en la muestra. Sin embargo, las distribuciones de masa (+; +) y los patrones de fragmentación (+) fueron idénticos (Figs. suplementarias 16-21). Estos resultados muestran que aunque se forman estructuras cíclicas, el AMPc canónico no es el producto principal. La comparación con un estándar analítico de adenosina también muestra que la adenosina, junto con una serie de especies isoméricas, se forma en la reacción de condensación de la P-ribosa y la adenina (Figs. 18-22). Aunque las formas canónicas de AMP y adenosina se confirmaron en estos experimentos, no fueron los principales productos en la reacción de deshidratación.
Cuando el fosfato se suministraba por separado como pirofosfato y reaccionaba con la adenina y la ribosa, se detectaba un compuesto con la masa de la adenosina y una baja cantidad de AMP y AMPc, y la adenosina seguía formándose cuando no había ninguna fuente de fosfato (Figs. suplementarias 33-41). Cabe destacar que hemos centrado intencionadamente nuestros estudios en la identificación de productos fosforilados (isómeros de AMP e isómeros de AMPc) y hemos prestado menos atención a la identificación de productos fosforilados que no sean isómeros de AMP y de AMPc30,31,32. Proponemos la formación de un enlace glicosídico entre el grupo hidroxilo de la ribosa y un grupo amino de la adenina, que se desencadena por la pérdida de una molécula de agua por evaporación. La reactividad relativa de los grupos aminos primarios y secundarios de la adenina está bien estudiada33 y, sin activación o sin la presencia de un grupo protector, normalmente se prefiere el enlace glucosídico en la amina primaria. Por lo tanto, no se espera que el isómero canónico de la adenosina/AMP sea un producto importante, ya que requeriría la reacción exclusivamente en la amina secundaria. Sin embargo, la reactividad es lo suficientemente alta en el sitio de la amina secundaria para que se formen los isómeros canónicos, aunque no como producto principal. En otras nucleobases, como la guanina, hay aún más grupos aminos accesibles, y el potencial de productos isoméricos es mayor. Es probable que la reactividad de la ribosa sea predominantemente a través de la posición anomérica, dando lugar a menos isómeros posibles, aunque pueden observarse algunos otros productos menores.
También se investigó la reactividad de otras nucleobases canónicas (citosina, guanina y timina) con la P-ribosa. Se detectaron masas correspondientes a estructuras de nucleósidos y nucleótidos tras la reacción de deshidratación de la guanina y la citosina con la P-ribosa (Fig. 3 y Figs. suplementarias 50-64). Las estructuras de glicosilación de la guanina se formaron en un grado relativamente bajo, probablemente debido a la limitada solubilidad de la guanina a bajo pH. Las cantidades de producto medidas para el monofosfato de 5-metiluridina (m5UMP) y la 5-metiluridina (nucleósido de timina) fueron incluso menores que sus equivalentes de guanina y citosina (Fig. 3 y Figs. Suplementarias 65, 66). Estos resultados pueden explicarse por la presencia de un grupo amino primario en la guanina y la citosina, que no existe en la timina. Aunque las tres nucleobases tienen grupos aminos secundarios, éstos son menos reactivos en la formación de enlaces glicosídicos. Por lo tanto, la formación de estructuras de nucleósidos y nucleótidos a través de una reacción de amina secundaria, como se requiere para formar productos de glicosilación canónicos, está desfavorecida en las nucleobases en las que hay aminas primarias disponibles. Esto tiene una implicación interesante para la adopción de la química de los ácidos nucleicos en el origen de la vida, ya que sugiere que los nucleótidos canónicos pueden haber sido inicialmente inadecuados hasta que haya surgido una maquinaria bioquímica adicional para mejorar la selectividad hacia los isómeros correctos. Por lo tanto, como era de esperar, aunque se formaron productos de nucleótidos y nucleósidos canónicos de citosina y guanina en nuestros experimentos, no se correspondieron con los principales picos observados (Figs. 42-49 suplementarias). Combinando estas dos observaciones (diferentes tiempos de retención pero la misma distribución de masas que los estándares canónicos en los EIC), podemos concluir que las especies de nucleótidos y nucleósidos formadas a partir de la reacción de deshidratación de la guanina/citosina con la P-ribosa eran principalmente especies isoméricas de los nucleótidos y nucleósidos canónicos (algunas posibles estructuras se muestran en las Figs. Suplementarias. 50, 51).
Típicamente, la formación de estructuras de nucleótidos se ha realizado en condiciones específicas dependiendo de la nucleobase utilizada, apuntando a un producto de reacción específico. En un enfoque alternativo, decidimos incluir múltiples nucleobases simultáneamente en la reacción con P-ribosa. Nuestro objetivo era determinar si la formación de productos con múltiples nucleobases bajo las mismas condiciones de reacción daría lugar a una mezcla de productos, o estaría dominada por uno. Esta reacción se llevó a cabo incluyendo dos o tres nucleobases (adenina, guanina y citosina) simultáneamente en el recipiente de reacción, junto con la P-ribosa. Se obtuvo una mezcla de productos de glicosilación que comprendía nucleótidos (AMP, GMP y CMP), así como los respectivos productos de nucleótidos cíclicos (cAMP, cGMP y cCMP) y nucleósidos (adenosina, guanosina y citidina) (Figs. suplementarias 67-95). Los productos de glicosilación de la guanina se formaron en un menor rendimiento que los de la adenina y la citosina, como era de esperar debido a la baja solubilidad de la guanina en condiciones ácidas.
Intercambio de nucleobases
El intercambio de nucleobases se observó cuando el Na+AMP se calentó durante 5 h a 90 °C en medios acuosos ácidos con citosina o guanina. El intercambio de nucleobases dio lugar a la formación de estructuras de nucleótidos (CMP o GMP), nucleótidos cíclicos (cCMP o cGMP) y nucleósidos (citidina o guanosina) (véanse las Figs. suplementarias 96-102, y la Tabla suplementaria 1 para los rendimientos semicuantitativos). En este experimento, el CMP y la citidina mostraron una tendencia creciente en intensidad, mientras que el cCMP alcanzó una intensidad máxima cuando era de 12,5 mM y luego descendió hasta una intensidad de 4,0 × 104 UA (Figs. suplementarias 102a y 155-158). A una concentración de citosina de 37,5 mM, el compuesto con mayor intensidad resultó ser el CMP y las intensidades medidas para el cCMP y la citidina fueron casi iguales. Se observaron dos especies isoméricas principales en los EIC de CMP y cCMP. Se detectaron las masas +, + y + en el caso del CMP, mientras que el cCMP mostró las masas +, + y + dentro de sus respectivas distribuciones de masas. En el caso de la citidina, + fue el principal pico detectado. Estas distribuciones de masas coincidían con las observadas en los estándares. Sin embargo, el tiempo de retención de los principales isómeros no se correspondía con el del CMP canónico ni con el de la citidina. Cuando se hizo reaccionar el AMP con concentraciones crecientes de guanina (Fig. Suplementaria 102b), los tres productos de glicosilación (GMP, cGMP y guanosina) alcanzaron un valor máximo cuando la concentración de guanina era de 2,5 mM (Figs. Suplementarias 160-162). Estos resultados fueron consecuencia de la limitada solubilidad de la guanina a pH ácido, por lo que, aunque se añadiera más guanina al recipiente de reacción, la concentración efectiva en la solución era la misma. Tras el valor máximo, la intensidad del GMPc y de la guanosina eran constantes, debido a la escasa solubilidad de la guanina. Sólo se observó un pequeño aumento en la intensidad de los tres productos de glicosilación de guanina cuando = 37,5 mM, lo que podría estar relacionado con una mayor presencia de guanina en la solución debido a la alta concentración añadida. En el EIC de GMP, se observó una zona amplia sin picos bien definidos, aunque destacaron dos picos principales. El + fue la única especie química, relacionada con los compuestos de guanina, detectada en la distribución de masas en su EIC. Se observaron cuatro picos, agrupados en pares, cuando se extrajo el EIC del GMPc de los datos de la EM y la distribución de masas mostró especies + y +. Por otro lado, el EIC de la guanosina presentó tres picos, el más intenso de los cuales mostró la presencia de + en su distribución de masas.
La formación de productos de glicosilación de citosina y guanina demostró que la escisión del enlace glicosídico del AMP se produjo en nuestras condiciones de reacción. Cuando se analizaron los EIC de AMP, cAMP y adenosina, se observaron varios picos en cada cromatograma, lo que apoya la teoría de que los enlaces glicosídicos sufren una hidrólisis/formación dinámica durante la reacción de deshidratación34. También se investigaron las reacciones de los nucleótidos de citosina y guanina con la adenina. En el caso de la reacción de deshidratación de CMP y adenina, no se pudieron observar productos correspondientes al intercambio de nucleobases (Figs. Suplementarias 103-108/a). Sin embargo, se detectaron claramente productos de glicosilación de adenina en la reacción de GMP con adenina (Figs. suplementarias 105-108/b). Esto se debe a que la hidrólisis de los enlaces glicosídicos en el GMP es más fácil que en el CMP, bajo las mismas condiciones de reacción34. También hemos llevado a cabo la reacción de intercambio de nucleobase con UMP y adenina, para comparar con el análogo directo de pirimidina de la adenina (Fig. Suplementaria 109). Los resultados fueron más similares a los rendimientos de CMP mostrados en la Fig. Suplementaria 108, que a los rendimientos de GMP, obteniendo un rendimiento muy bajo para los productos de glicosilación de adenina en la reacción de UMP que no es suficiente para permitir la detección de AMP y cAMP.
El efecto de los aminoácidos en la distribución de los productos de glicosilación
Como se ha mencionado anteriormente, los aminoácidos, los nucleótidos y sus bloques de construcción podrían haber estado presentes en la Tierra primitiva al mismo tiempo. Por tanto, los productos de una reacción de copolimerización, o incluso los productos resultantes de algún efecto catalítico de un tipo de polímero sobre el otro, podrían haberse producido en un entorno prebiótico. Para estudiar la correactividad de los bloques de construcción de nucleótidos y los aminoácidos en una deshidratación de una sola vez, se incluyó glicina, el aminoácido más simple, en las reacciones de deshidratación de la P-ribosa y las respectivas nucleobases. La incorporación de glicina tuvo un claro efecto en la formación de los productos de glicosilación, haciendo que disminuyera el rendimiento global de los productos con la masa de los isómeros de AMP, los isómeros de AMPc y la adenosina (Fig. 4a y Figs. Suplementarias 28-32). Esto indica que la glicina juega un papel en el consumo de bloques de construcción de nucleótidos (P-ribosa y/o adenina) a través de una reacción lateral, o que se une a la estructura del producto, cambiando su masa. El análisis EIC para estas reacciones revela picos correspondientes a la masa de los aductos de glicina (es decir, AMP-Gly, cAMP-Gly, adenosina-Gly y adenina-Gly) (Figs. 115-122 suplementarias), aunque estos productos secundarios no se forman en cantidad suficiente para explicar todos los cambios observados. Los aductos de glicina también se confirmaron utilizando glicina deuterada como material de partida junto con P-ribosa y adenina, lo que provocó cambios en la distribución isotópica de las masas de los aductos (Figs. 123, 124 suplementarias). Se obtuvo un rendimiento semicuantitativo máximo del 59% para la formación de productos de glicosilación (isómeros de AMP, isómeros de AMP cíclico y adenosina) en la reacción de P-ribosa y adenina; sin embargo, sólo se obtuvo un rendimiento del 46% cuando la glicina también estaba presente en el medio de reacción (Fig. Suplementaria 144). Cuantificar los rendimientos de todos los posibles isómeros individuales es técnicamente difícil, pero se pudieron determinar rendimientos semicuantitativos de algunos isómeros utilizando estándares puros: La adenosina 5′-monofosfato y la adenosina 2′,3′-monofosfato cíclico se encontraron en un 38,7% y 18,2%, respectivamente, en ausencia de glicina, mientras que el rendimiento en presencia de glicina se encontró significativamente disminuido (<2%) para ambos isómeros.
La glicina también afectó a la distribución de las especies isoméricas, y se observaron claras diferencias en comparación con el cromatograma del pico base (CPB) de la reacción de la P-ribosa y la adenina, en presencia y ausencia de glicina (Fig. 4b y Figs. suplementarias 110-114). Estos datos indicaron la presencia de diferentes especies químicas y un cambio resultante en la distribución de masas entre las reacciones con y sin glicina. A continuación se analizaron los EIC individuales para cada producto de glicosilación de adenina, observándose claras diferencias en las intensidades relativas de los picos cuando se añadía glicina. Estos resultados muestran claramente que la glicina tiene un efecto selectivo sobre las especies isoméricas que se forman preferentemente. Se sabe que la glicina reacciona fácilmente con otras aminas en condiciones de deshidratación12 , y es probable que reaccione con las aminas primarias de las nucleobases. Los productos laterales híbridos que incluyen glicina (Gly-AMP, Gly-cAMP, Gly-Adenosina, Gly-Adenina) se detectaron en un rendimiento de ~1% (Fig. Suplementaria 145), sin embargo, este pequeño porcentaje tiene un efecto importante en la distribución isomérica de los productos de glicosilación de adenina (ver Figs. Suplementarias 146, 147). Se detectó un cambio en la distribución isotópica de las masas de los productos híbridos (Figs. suplementarias 123, 124) cuando se incluyó glicina deuterada en la reacción de deshidratación, confirmando la inclusión de glicina en las estructuras híbridas.
También se observó un efecto similar en la distribución de isómeros cuando la P-ribosa reaccionó con citosina/guanina en presencia de glicina (Fig. 4c, Figs. suplementarias 125-140). Las intensidades máximas de las diferentes especies de isómeros disminuyeron (GMP, CMP, cGMP, cCMP, guanosina y citidina), mientras que la distribución de las intensidades relativas también se vio afectada. Las diferencias entre los experimentos se verificaron rigurosamente utilizando un método estadístico como el análisis de cluster de los datos EIC para segmentar las muestras, en presencia y ausencia de glicina, en grupos/clusters constitutivos con características comunes (Fig. 5). El objetivo del análisis de conglomerados en este estudio es agrupar los datos (es decir, la formación de estructuras de nucleótidos y nucleósidos) en conjuntos constituyentes con características compartidas (por ejemplo, la adición de glicina frente a la ausencia de glicina). Este análisis debe demostrar una alta homogeneidad interna dentro de los clusters/grupos y una alta heterogeneidad externa entre los clusters/grupos. La Fig. 5 muestra un dendrograma con enlace «Wards «35. Para identificar los clusters en el dendrograma, hemos coloreado los espectros según la presencia de glicina (glicina – rojo, sin glicina – negro, en blanco – azul). Como puede observarse, las muestras que contienen glicina se agrupan. Un grupo corresponde a la P-ribosa + adenina + glicina (tres muestras), que se separa de las muestras sin glicina. Un segundo grupo corresponde a P-ribosa + guanina + glicina y P-ribosa + citosina + glicina. Las muestras que contienen adenina se separan en un clúster más grande que se distingue de las otras muestras, lo que indica una fuerte influencia de la adenina en la reacción. De hecho, hay una serie de otros posibles productos y reacciones que podrían tener lugar en las condiciones de reacción llevadas a cabo (véase la Nota complementaria 1 y las Figs. 150-162 complementarias para más detalles).
También se incluyeron otros aminoácidos en la reacción de deshidratación de la adenina con P-ribosa para probar si también tendrían algún efecto en la distribución isomérica de los productos de glicosilación (Figs. Suplementarias 141-143). Los seis aminoácidos seleccionados para este estudio (arginina, ácido glutámico, treonina, metionina, fenilalanina y triptófano) tienen cadenas laterales diferentes, con naturalezas químicas y grupos funcionales distintos. Cuando se compararon los resultados con los datos obtenidos de la reacción de sólo P-ribosa y adenina, se observaron cambios en la distribución isomérica del AMP en todas las reacciones, excepto en el caso del triptófano, lo que podría atribuirse a limitaciones conformacionales debidas a la presencia de la cadena lateral indólica del triptófano. Al analizar los EIC del AMPc, se observaron cambios menores en la intensidad relativa de los picos isoméricos. Sin embargo, se observó una clara diferencia en el EIC de la adenosina sólo para las reacciones que incluían fenilalanina y treonina.