Formation simultanée de produits de glycosylation
La formation de structures nucléoside et nucléotide à partir de précurseurs simples a été réalisée simultanément avec trois nucléobases par des réactions de déshydratation. Cela contraste avec les travaux précédents dans ce domaine, où les conditions étaient optimisées pour favoriser des produits spécifiques24,25,26. Dans une expérience typique de glycosylation, l’adénine et le P-ribose ont été chauffés à 90 °C pendant 5 h à pH 2,5. Nous avons observé la formation du nucléotide adénine monophosphate (AMP) (et de ses isomères) lorsque l’adénine et le P-ribose étaient combinés. Les chromatogrammes d’ions extraits (EIC) obtenus à partir de l’analyse HPLC-MS des produits ont révélé plusieurs pics avec une correspondance m/z + et + (figures supplémentaires 13-15). La comparaison avec les normes a confirmé que l’AMP correspond au pic trouvé à RT = 4,2 min (figures supplémentaires 5, 6) ; d’autres pics importants pourraient correspondre à des isomères de l’AMP, comme l’isomère N6-ribosylé. Afin de le confirmer, une réaction d’hydrolyse en présence de NaOH (0,1 M) a été réalisée, dans le but de différencier les différents isomères, considérant que l’isomère N6-ribosylé est plus enclin à l’hydrolyse. Cependant, une légère perturbation des pics peut être observée, ce qui rend difficile la confirmation de l’identité de l’isomère N6-ribosylé. Nous avons ensuite analysé deux standards purs de deux isomères différents (adénosine 3′- monophosphate et adénosine 5′-monophosphate monohydraté) individuellement et en mélange afin d’élucider le profil d’élution des isomères (figures supplémentaires 148, 149). Un décalage du temps de rétention peut être observé pour le mélange standard fournissant une meilleure corrélation avec l’élution de ces composés dans l’échantillon réel. Bien qu’il soit difficile de différencier les isomères, nous pouvons confirmer la présence d’au moins deux isomères dans les produits AMP en comparant le profil d’élution du mélange standard à l’échantillon réel. Il est maintenant clair que la formation de différents isomères (Fig. 12 supplémentaire) est une raison possible pour l’élution de nucléotides avec les mêmes masses à des temps de rétention différents. De plus, l’analyse MS/MS de nos produits de réaction révèle une fragmentation de l’AMP (et de ses isomères) en adénine (m/z = 136.0617 ± 0.01) (Supplementary Fig. 20) ; ceci est cohérent avec la fragmentation de l’étalon canonique AMP. Le mécanisme réactionnel que nous proposons consiste en la formation d’une liaison glycosidique entre un groupe 1′-OH du ribose et un groupe amino de l’adénine (voir la figure supplémentaire 12).
Les réactions en fonction du temps montrent que l’évaporation de l’eau est la principale force motrice de la formation des produits de glycosylation, montrant une augmentation significative de la formation de structures nucléosidiques et nucléotidiques dans la période de temps comprise entre 2 et 4 h (figure 2a). Cela correspond à la plage de temps où le volume de l’échantillon est considérablement réduit, et où les réactifs sont extrêmement concentrés. Après 5-6 h de réaction, l’échantillon atteint la sécheresse et la vitesse de réaction (suivie de l’intensité dans les mesures HPLC-MS) se stabilise. En plus de l’AMP, les produits contenant des liaisons glycosidiques, y compris les nucléotides cycliques (c’est-à-dire l’AMPc)27, et les nucléosides (c’est-à-dire l’adénosine), ont été détectés par RP-HPLC-MS, MS/MS, et testés pour la formation de dérivés 1,N6-etheno28,29, confirmés par comparaison avec les standards (Fig. 2, Fig. supplémentaires 7-11, Fig. supplémentaires 23-27). Les temps de rétention des étalons canoniques 2′,3′-cAMP et 3′,5′-cAMP ne correspondaient pas aux temps de rétention des pics EIC dans l’échantillon. Cependant, les distributions de masse (+ ; +) et les schémas de fragmentation (+) étaient identiques (figures supplémentaires 16-21). Ces résultats montrent que si des structures cycliques sont formées, l’AMPc canonique n’est pas le produit principal. La comparaison avec un standard analytique d’adénosine montre également que l’adénosine, ainsi qu’un certain nombre d’espèces isomériques, est formée dans la réaction de condensation du P-ribose et de l’adénine (figures supplémentaires 18-22). Bien que les formes canoniques de l’AMP et de l’adénosine aient été confirmées dans ces expériences, elles ne sont pas les principaux produits de la réaction de déshydratation.
Lorsque le phosphate a été fourni séparément sous forme de pyrophosphate et a réagi avec l’adénine et le ribose, un composé ayant la masse de l’adénosine a été détecté et une faible quantité d’AMP et d’AMPc a été détectée, et l’adénosine s’est encore formée lorsqu’aucune source de phosphate n’était présente (figures supplémentaires 33-41). Il convient de noter que nous avons intentionnellement concentré nos études sur l’identification des produits phosphorylés (isomères d’AMP et isomères d’AMPc) et accordé moins d’attention à l’identification des produits phosphorylés qui ne sont pas des isomères d’AMP et des isomères d’AMPc30,31,32. Nous proposons la formation d’une liaison glycosidique entre le groupe hydroxyle du ribose et un groupe amino de l’adénine, qui est déclenchée par la perte d’une molécule d’eau par évaporation. La réactivité relative des groupes amine primaire et secondaire dans l’adénine est bien étudiée33 et sans activation ou la présence d’un groupe protecteur, la liaison glycosidique au niveau de l’amine primaire est normalement préférée. Par conséquent, l’isomère canonique de l’adénosine/AMP ne devrait pas être un produit majeur, car il nécessiterait une réaction exclusivement au niveau de l’amine secondaire. Cependant, la réactivité est suffisamment élevée au niveau du site de l’amine secondaire pour que les isomères canoniques soient formés, mais pas comme produit principal. Dans d’autres nucléobases, comme la guanine, il y a encore plus de groupes amine accessibles, et le potentiel de produits isomères est plus grand. La réactivité du ribose est susceptible de passer principalement par la position anomérique, conduisant à moins d’isomères possibles, bien que d’autres produits mineurs puissent être observés.
La réactivité d’autres nucléobases canoniques (cytosine, guanine et thymine) avec le P-ribose a également été étudiée. Des masses correspondant à des structures nucléosidiques et nucléotidiques ont été détectées après la réaction de déshydratation de la guanine et de la cytosine avec le P-ribose (figure 3 et figures supplémentaires 50-64). Les structures de glycosylation de la guanine ont été formées dans une mesure relativement faible, probablement en raison de la solubilité limitée de la guanine à faible pH. Les quantités de produits mesurées pour le 5-méthyluridine monophosphate (m5UMP) et la 5-méthyluridine (nucléoside de la thymine) étaient encore plus faibles que leurs équivalents à partir de la guanine et de la cytosine (Fig. 3 et Fig. supplémentaires 65, 66). Ces résultats peuvent être expliqués par la présence d’un groupe amino primaire dans la guanine et la cytosine, qui fait défaut à la thymine. Bien que les trois nucléobases possèdent des groupes amine secondaires, ceux-ci sont moins réactifs dans la formation de liaisons glycosidiques. Par conséquent, la formation de structures nucléosidiques et nucléotidiques par une réaction d’amine secondaire, comme cela est nécessaire pour former des produits de glycosylation canonique, est défavorisée dans les nucléobases où des amines primaires sont disponibles. Cela a une implication intéressante pour l’adoption de la chimie des acides nucléiques dans l’origine de la vie, car cela suggère que les nucléotides canoniques peuvent avoir été initialement inadaptés jusqu’à ce que d’autres mécanismes biochimiques aient émergé pour améliorer la sélectivité vers les isomères corrects. Par conséquent, comme prévu, alors que les produits nucléotidiques et nucléosidiques canoniques de la cytosine et de la guanine ont été formés dans nos expériences, ils ne correspondent pas aux principaux pics observés (figures supplémentaires 42-49). En combinant ces deux observations (temps de rétention différents mais même distribution de masse que les standards canoniques dans les EIC), nous pouvons conclure que les espèces de nucléotides et de nucléosides formées à partir de la réaction de déshydratation de la guanine/cytosine avec le P-ribose étaient principalement des espèces isomériques des nucléotides et des nucléosides canoniques (certaines structures possibles sont présentées dans les figures supplémentaires. 50, 51).
Typiquement, la formation de structures nucléotidiques a été réalisée dans des conditions spécifiques en fonction de la nucléobase utilisée, en ciblant un produit de réaction spécifique. Dans une approche alternative, nous avons décidé d’inclure plusieurs nucléobases simultanément dans la réaction avec le P-ribose. Notre objectif était de déterminer si la formation de produits avec plusieurs nucléobases dans les mêmes conditions de réaction donnerait un mélange de produits, ou serait dominée par un seul. Cette réaction a été réalisée en incluant deux ou trois nucléobases (adénine, guanine et cytosine) simultanément dans le récipient de réaction, avec du P-ribose. Un mélange de produits de glycosylation a été obtenu, comprenant des nucléotides (AMP, GMP et CMP) ainsi que les produits respectifs de nucléotides cycliques (cAMP, cGMP et cCMP) et de nucléosides (adénosine, guanosine et cytidine) (figures supplémentaires 67-95). Les produits de glycosylation de la guanine ont été formés avec un rendement plus faible que ceux de l’adénine et de la cytosine, comme prévu en raison de la faible solubilité de la guanine dans des conditions acides.
Échange de nucléobase
Un échange de nucléobase a été observé lorsque le Na+AMP a été chauffé pendant 5 h à 90 °C dans des milieux aqueux acides avec de la cytosine ou de la guanine. L’échange de nucléobases a entraîné la formation de structures de nucléotides (CMP ou GMP), de nucléotides cycliques (cCMP ou cGMP) et de nucléosides (cytidine ou guanosine) (voir les figures supplémentaires 96-102 et le tableau supplémentaire 1 pour les rendements semi-quantitatifs). Dans cette expérience, le CMP et la cytidine ont montré une tendance à l’augmentation de l’intensité, tandis que le cCMP a atteint une intensité maximale lorsqu’il était à 12,5 mM, puis a chuté jusqu’à une intensité de 4,0 × 104 UA (figures supplémentaires 102a et 155-158). À une concentration de cytosine de 37,5 mM, le composé ayant l’intensité la plus élevée s’est avéré être le CMP et les intensités mesurées pour le cCMP et la cytidine étaient presque les mêmes. Deux espèces isomères principales ont été observées dans les EIC du CMP et du cCMP. Des masses +, + et + ont été détectées dans le cas du CMP, tandis que le cCMP a montré +, + et + dans leurs distributions de masse respectives. Dans le cas de la cytidine, + était le principal pic détecté. Ces distributions de masse correspondent à celles observées dans les standards. Cependant, le temps de rétention des principaux isomères ne correspondait pas à celui de la CMP et de la cytidine canonique. Lorsque l’AMP a été mis en réaction avec des concentrations croissantes de guanine (figure supplémentaire 102b), les trois produits de glycosylation (GMP, cGMP et guanosine) ont atteint une valeur maximale lorsque la concentration de guanine était de 2,5 mM (figures supplémentaires 160-162). Ces résultats étaient la conséquence de la solubilité limitée de la guanine à pH acide, ainsi, même si plus de guanine était ajoutée au récipient de réaction, la concentration effective dans la solution était la même. Après la valeur maximale, l’intensité du GMPc et de la guanosine était constante, en raison de la faible solubilité de la guanine. Seule une faible augmentation de l’intensité des trois produits de glycosylation de la guanine a été observée lorsque = 37,5 mM, ce qui pourrait être lié à une plus grande présence de guanine dans la solution en raison de la forte concentration ajoutée. Dans la CIE du GMP, une large zone sans pics bien définis a été observée, bien que deux pics principaux se distinguent. + était la seule espèce chimique, liée aux composés de guanine, détectée dans la distribution de masse sur son EIC. Quatre pics, regroupés par paires, ont été observés lorsque l’EIC du cGMP a été extrait des données MS et que la distribution de masse a montré les espèces + et +. En revanche, l’EIC de la guanosine a présenté trois pics, dont le plus intense a montré la présence de + dans sa distribution de masse.
La formation de produits de glycosylation de la cytosine et de la guanine a démontré que le clivage de la liaison glycosidique de l’AMP s’est produit dans nos conditions de réaction. Lorsque les EIC de l’AMP, de l’AMPc et de l’adénosine ont été analysés, plusieurs pics ont été observés dans chaque chromatogramme, soutenant la théorie selon laquelle les liaisons glycosidiques subissent une hydrolyse/formation dynamique pendant la réaction de déshydratation34. Les réactions des nucléotides cytosine et guanine avec l’adénine ont également été étudiées. Dans le cas de la réaction de déshydratation de la CMP et de l’adénine, aucun produit correspondant à un échange de nucléobase n’a pu être observé (figures supplémentaires 103-108/a). Cependant, des produits de glycosylation de l’adénine ont été clairement détectés dans la réaction du GMP avec l’adénine (Figures supplémentaires 105-108/b). Ceci est dû au fait que l’hydrolyse des liaisons glycosidiques dans le GMP est plus facile que pour le CMP, dans les mêmes conditions de réaction34. Nous avons également réalisé la réaction d’échange de nucléobase avec l’UMP et l’adénine, afin de la comparer avec l’analogue pyrimidine direct de l’adénine (Fig. 109 supplémentaire). Les résultats étaient plus similaires aux rendements CMP présentés dans la figure supplémentaire 108, qu’aux rendements GMP, obtenant un rendement très faible pour les produits de glycosylation de l’adénine dans la réaction UMP, ce qui n’est pas suffisant pour permettre la détection de l’AMP et de l’AMPc.
Effet des acides aminés sur la distribution des produits de glycosylation
Comme mentionné précédemment, les acides aminés, les nucléotides et leurs éléments constitutifs auraient pu être présents sur la Terre primitive en même temps. Par conséquent, les produits d’une réaction de copolymérisation, ou même les produits résultant d’un certain effet catalytique d’un type de polymère sur l’autre, pourraient avoir eu lieu dans un environnement prébiotique. Pour étudier la coréactivité des blocs de construction nucléotidiques et des acides aminés dans une déshydratation en un seul point, la glycine, l’acide aminé le plus simple, a été incluse dans les réactions de déshydratation du P-ribose et des nucléobases respectives. L’incorporation de la glycine a eu un effet clair sur la formation des produits de glycosylation, entraînant une diminution du rendement global des produits avec la masse des isomères de l’AMP, des isomères de l’AMPc et de l’adénosine (figure 4a et figures supplémentaires 28-32). Cela indique que la glycine joue un rôle soit en consommant les blocs de construction des nucléotides (P-ribose et/ou adénine) par une réaction secondaire, soit en se fixant à la structure du produit, ce qui modifie sa masse. L’analyse EIC pour ces réactions révèle des pics correspondant à la masse des adduits de la glycine (c’est-à-dire AMP-Gly, cAMP-Gly, adénosine-Gly et adénine-Gly) (figures supplémentaires 115-122), bien que ces produits secondaires ne soient pas formés en quantité suffisante pour expliquer tous les changements observés. Les adduits de glycine ont également été confirmés en utilisant de la glycine deutérée comme produit de départ avec du P-ribose et de l’adénine, ce qui a provoqué des changements dans la distribution isotopique des masses d’adduits (Figures supplémentaires 123, 124). Un rendement semi-quantitatif maximal de 59 % a été obtenu pour la formation de produits de glycosylation (isomères d’AMP, isomères d’AMP cyclique et adénosine) dans la réaction du P-ribose et de l’adénine ; cependant, un rendement de 46 % seulement a été obtenu lorsque la glycine était également présente dans le milieu réactionnel (figure supplémentaire 144). La quantification des rendements de tous les isomères individuels possibles est techniquement difficile, mais les rendements semi-quantitatifs de certains isomères ont pu être déterminés en utilisant des standards purs : L’adénosine 5′-monophosphate et l’adénosine 2′,3′-monophosphate cyclique ont été trouvés à 38,7 % et 18,2 %, respectivement, en l’absence de glycine, tandis que le rendement en présence de glycine a été trouvé considérablement abaissé (<2 %) pour les deux isomères.
La glycine a également affecté la distribution des espèces isomères, et des différences claires ont été observées par rapport au chromatogramme du pic de base (BPC) de la réaction de la P-ribose et de l’adénine, en présence et en l’absence de glycine (figure 4b et figures supplémentaires 110-114). Ces données indiquent la présence d’espèces chimiques différentes et un changement résultant dans la distribution de masse entre les réactions avec et sans glycine. Les EIC individuels ont ensuite été analysés pour chaque produit de glycosylation de l’adénine, ce qui a permis d’observer des différences claires dans les intensités relatives des pics lorsque la glycine était ajoutée. Ces résultats montrent clairement que la glycine a un effet sélectif sur les espèces isomériques qui sont formées préférentiellement. La glycine est connue pour réagir facilement avec d’autres amines dans des conditions de déshydratation12, et elle est susceptible de réagir avec les amines primaires des nucléobases. Les produits secondaires hybrides incluant la glycine (Gly-AMP, Gly-cAMP, Gly-Adenosine, Gly-Adenine) ont été détectés dans un rendement de ~1% (Fig. 145 supplémentaire), cependant, ce petit pourcentage a un effet important sur la distribution isomérique des produits de glycosylation de l’adénine (voir Fig. 146, 147 supplémentaire). Un changement dans la distribution isotopique des masses des produits hybrides a été détecté (figures supplémentaires 123, 124) lorsque de la glycine deutérée a été incluse dans la réaction de déshydratation, confirmant l’inclusion de la glycine dans les structures hybrides.
Un effet similaire sur la distribution isomérique a également été observé lorsque le P-ribose a été mis en réaction avec la cytosine/guanine en présence de glycine (figure 4c, figures supplémentaires 125-140). Les intensités maximales des différentes espèces isomères ont diminué (GMP, CMP, cGMP, cCMP, guanosine et cytidine), tandis que la distribution des intensités relatives a également été affectée. Les différences entre les expériences ont été rigoureusement vérifiées à l’aide d’une méthode statistique telle que l’analyse en grappes des données EIC afin de segmenter les échantillons, en présence et en l’absence de glycine, en groupes/clusters constitutifs présentant des caractéristiques communes (Fig. 5). L’objectif de l’analyse en grappes dans cette étude est de regrouper les données (c’est-à-dire la formation de la structure des nucléotides et des nucléosides) en ensembles constitutifs ayant des caractéristiques communes (par exemple, ajout de glycine contre absence de glycine). Cette analyse devrait démontrer une grande homogénéité interne au sein des clusters/groupes et une grande hétérogénéité externe entre les clusters/groupes. La figure 5 présente un dendrogramme avec un couplage « Wards « 35. Pour identifier les clusters dans le dendrogramme, nous avons coloré les spectres en fonction de la présence de glycine (glycine – rouge, pas de glycine – noir, blanc – bleu). Comme on peut l’observer, les échantillons contenant de la glycine se regroupent. Un groupe correspond à P-ribose + adénine + glycine (trois échantillons), qui est séparé des échantillons sans glycine. Un deuxième groupe correspond à P-ribose + guanine + glycine et P-ribose + cytosine + glycine. Les échantillons contenant de l’adénine se séparent en un cluster plus grand qui se distingue des autres échantillons, ce qui indique une forte influence de l’adénine dans la réaction. En effet, il existe un certain nombre d’autres produits et réactions possibles qui pourraient avoir lieu dans les conditions de réaction menées (voir la note supplémentaire 1 et les figures supplémentaires 150-162 pour plus de détails).
D’autres acides aminés ont également été inclus dans la réaction de déshydratation de l’adénine avec le P-ribose pour tester s’ils auraient également un certain effet sur la distribution isomérique des produits de glycosylation (figures supplémentaires 141-143). Les six acides aminés sélectionnés pour cette étude (arginine, acide glutamique, thréonine, méthionine, phénylalanine et tryptophane) ont des chaînes latérales différentes, avec des natures chimiques et des groupes fonctionnels différents. Lorsque les résultats ont été comparés aux données obtenues à partir de la réaction du seul P-ribose et de l’adénine, des changements dans la distribution isomérique de l’AMP ont été observés dans toutes les réactions, sauf dans le cas du tryptophane, ce qui pourrait être attribué à des limitations conformationnelles dues à la présence de la chaîne latérale indole du tryptophane. En analysant les EICs de l’AMPc, de plus petits changements dans l’intensité relative des pics isomériques ont été remarqués. Cependant, une nette différence a été observée dans l’EIC de l’adénosine uniquement pour les réactions incluant la phénylalanine et la thréonine.