Gelijktijdige vorming van glycosyleringsproducten
De vorming van nucleoside- en nucleotidestructuren uit eenvoudige precursoren werd gelijktijdig bereikt met drie nucleobasen door dehydratatiereacties. Dit is in tegenstelling tot eerder werk op dit gebied, waar de omstandigheden werden geoptimaliseerd om specifieke producten te bevoordelen24,25,26. In een typisch glycosyleringsexperiment werden adenine en P-ribose verwarmd bij 90 °C gedurende 5 uur bij pH 2,5. Wij zagen de vorming van adeninemonofosfaat (AMP) nucleotide (en zijn isomeren) wanneer adenine en P-ribose werden gecombineerd. De geëxtraheerde ionchromatogrammen (EIC’s) verkregen uit HPLC-MS analyse van de producten onthulden verschillende pieken met m/z overeenkomende + en + (Aanvullende Figs. 13-15). Vergelijking met standaarden bevestigde dat het AMP overeenkomt met de piek gevonden bij RT = 4,2 min (Aanvullende Fig. 5, 6); andere belangrijke pieken kunnen overeenkomen met AMP-isomeren, zoals het N6-ribosylated isomeer. Om dit te bevestigen werd een hydrolysereactie in aanwezigheid van NaOH (0,1 M) uitgevoerd, in een poging om onderscheid te maken tussen de verschillende isomeren, gezien het feit dat de N6-ribosylated isomeer meer vatbaar is voor hydrolyse. Er kan echter een lichte verstoring van de pieken worden waargenomen, waardoor het moeilijk is de identiteit van het N6-ribosylisomeer te bevestigen. Vervolgens hebben wij twee zuivere standaards van twee verschillende isomeren (adenosine 3′-monofosfaat en adenosine 5′-monofosfaat monohydraat) afzonderlijk en in een mengsel geanalyseerd om het elutieprofiel van de isomeren op te helderen (aanvullende fig. 148, 149). Voor het standaardmengsel kan een verschuiving in de retentietijd worden waargenomen, waardoor een betere correlatie ontstaat met de elutie van deze verbindingen in het echte monster. Hoewel het moeilijk is om onderscheid te maken tussen isomeren, kunnen we de aanwezigheid van ten minste twee isomeren binnen de AMP-producten bevestigen door het elutieprofiel van het standaardmengsel te vergelijken met dat van het echte monster. Het is nu duidelijk dat de vorming van verschillende isomeren (aanvullende fig. 12) een mogelijke reden is voor de elutie van nucleotiden met dezelfde massa’s bij verschillende retentietijden. Bovendien onthult MS/MS-analyse van onze reactieproducten fragmentatie van AMP (en zijn isomeren) tot adenine (m/z = 136,0617 ± 0,01) (supplementaire fig. 20); dit is consistent met fragmentatie van de canonieke AMP-standaard. Ons voorgestelde reactiemechanisme bestaat uit de vorming van een glycosidebinding tussen een 1′-OH groep van ribose en een aminogroep van adenine (zie Aanvullende Fig. 12).
Tijdsverloopreacties tonen aan dat waterverdamping de belangrijkste drijvende kracht is voor de vorming van glycosylatieproducten, waarbij een significante toename van de vorming van nucleoside- en nucleotidestructuren wordt waargenomen in de tijdsperiode tussen 2 en 4 uur (Fig. 2a). Dit komt overeen met de tijdspanne waarin het monstervolume drastisch wordt verminderd en de reagentia uiterst geconcentreerd zijn. Na 5-6 uur reactie bereikt het monster droogte en stabiliseert de reactiesnelheid (gevolgd door de intensiteit in HPLC-MS-metingen). Naast AMP werden glycosidebinding-bevattende producten, waaronder cyclische nucleotiden (d.w.z. cAMP)27 en nucleosiden (d.w.z. adenosine), gedetecteerd met RP-HPLC-MS, MS/MS, en getest op de vorming van 1,N6-etheno-derivaten28,29, bevestigd door vergelijking met standaarden (Fig. 2, aanvullende Fig. 7-11, aanvullende Fig. 23-27). De retentietijden van 2′,3′-cAMP en 3′,5′-cAMP canonieke standaarden kwamen niet overeen met de retentietijden van de EIC-pieken in het monster. De massadistributies (+; +) en fragmentatiepatronen (+) waren echter identiek (aanvullende fig. 16-21). Deze resultaten tonen aan dat er weliswaar cyclische structuren worden gevormd, maar dat het canonieke cAMP niet het hoofdproduct is. Vergelijking met een analytische standaard voor adenosine toont ook aan dat adenosine, samen met een aantal isomeren, gevormd wordt in de condensatiereactie van P-ribose en adenine (supplementaire fig. 18-22). Hoewel de canonieke vormen van AMP en adenosine in deze experimenten werden bevestigd, waren zij niet de belangrijkste producten in de dehydratatiereactie.
Wanneer fosfaat afzonderlijk werd geleverd als pyrofosfaat en reageerde met adenine en ribose, werd een verbinding met de massa van adenosine gedetecteerd en een lage hoeveelheid AMP en cAMP werden gedetecteerd, en adenosine nog steeds gevormd wanneer er geen fosfaatbron aanwezig was (supplementaire Figs. 33-41). Het is vermeldenswaard dat wij onze studies opzettelijk hebben gericht op het identificeren van gefosforyleerde producten (AMP-isomeren en cAMP-isomeren) en minder aandacht hebben besteed aan het identificeren van gefosforyleerde producten die geen AMP-isomeren en cAMP-isomeren zijn30,31,32. Wij stellen de vorming voor van een glycosidebinding tussen de hydroxylgroep van ribose en een aminogroep van adenine, die op gang wordt gebracht door het verlies van een watermolecule door verdamping. De relatieve reactiviteit van de primaire en secundaire aminegroepen in adenine is goed bestudeerd33 en zonder activering of de aanwezigheid van een beschermende groep heeft een glycosidebinding aan het primaire amine normaliter de voorkeur. Daarom wordt niet verwacht dat de canonieke isomeer van adenosine/AMP een belangrijk product zal zijn, aangezien daarvoor uitsluitend reactie op het secundaire amine nodig zou zijn. De reactiviteit op de plaats van het secundaire amine is echter voldoende hoog om de canonieke isomeren te vormen, zij het niet als hoofdproduct. In andere nucleobasen, zoals guanine, zijn er nog meer toegankelijke aminogroepen, en is het potentieel voor isomere producten groter. De reactiviteit van ribose verloopt waarschijnlijk voornamelijk via de anomere positie, waardoor er minder isomeren mogelijk zijn, hoewel er enkele andere minder belangrijke producten kunnen worden waargenomen.
De reactiviteit van andere canonieke nucleobasen (cytosine, guanine en thymine) met P-ribose werd ook onderzocht. Massa’s die overeenkomen met nucleoside- en nucleotidestructuren werden gedetecteerd na de dehydratatiereactie van guanine en cytosine met P-ribose (Fig. 3 en aanvullende Figs. 50-64). Guanine glycosylatie structuren werden in een relatief lage mate gevormd, waarschijnlijk als gevolg van de beperkte oplosbaarheid van guanine bij lage pH. De gemeten producthoeveelheden voor 5-methyluridine monofosfaat (m5UMP) en 5-methyluridine (thymine nucleoside) waren zelfs lager dan hun equivalenten van guanine en cytosine (Fig. 3 en aanvullende Figs. 65, 66). Deze resultaten kunnen worden verklaard door de aanwezigheid van een primaire aminogroep in guanine en cytosine, die ontbreekt in thymine. Hoewel alle drie nucleobasen secundaire aminogroepen hebben, zijn deze minder reactief bij de vorming van glycosidebindingen. Vandaar dat de vorming van nucleoside- en nucleotidestructuren door een secundaire aminereactie, zoals vereist is om canonieke glycosyleringsproducten te vormen, niet gewenst is in nucleobasen waar primaire amines beschikbaar zijn. Dit heeft een interessante implicatie voor de toepassing van nucleïnezuurchemie in de oorsprong van het leven, omdat het suggereert dat de canonieke nucleotiden aanvankelijk ongeschikt kunnen zijn geweest, totdat er verdere biochemische machinerie was ontstaan om de selectiviteit naar de juiste isomeren te vergroten. Daarom werden, zoals verwacht, in onze experimenten weliswaar canonieke nucleotide- en nucleosideproducten van cytosine en guanine gevormd, maar deze kwamen niet overeen met de voornaamste pieken die werden waargenomen (aanvullende Fig. 42-49). Door deze twee waarnemingen te combineren (verschillende retentietijden maar dezelfde massaverdeling als de canonieke standaards in de EIC’s), kunnen we concluderen dat de nucleotide- en nucleosidesoorten gevormd uit de dehydratatiereactie van guanine/cytosine met P-ribose voornamelijk isomere soorten van de canonieke nucleotiden en nucleosiden waren (enkele mogelijke structuren worden getoond in de aanvullende Figs. 50, 51).
Typisch is de vorming van nucleotidestructuren uitgevoerd onder specifieke omstandigheden, afhankelijk van de gebruikte nucleobase, gericht op een specifiek reactieproduct. In een alternatieve aanpak besloten wij om meerdere nucleobasen tegelijk in de reactie met P-ribose te betrekken. Ons doel was te bepalen of productvorming met meerdere nucleobasen onder dezelfde reactieomstandigheden een mengsel van producten zou opleveren, of gedomineerd zou worden door één product. Deze reactie werd uitgevoerd door twee of drie nucleobasen (adenine, guanine en cytosine) tegelijk in het reactievat op te nemen, samen met P-ribose. Er werd een mengsel van glycosyleringsproducten verkregen, bestaande uit nucleotiden (AMP, GMP en CMP) alsmede de respectieve cyclische nucleotiden (cAMP, cGMP en cCMP) en nucleosideproducten (adenosine, guanosine en cytidine) (Aanvullende Figs. 67-95). Guanine glycosyleringsproducten werden gevormd in een lagere opbrengst dan die van adenine en cytosine, zoals verwacht als gevolg van de lage oplosbaarheid van guanine onder zure omstandigheden.
Nucleobase uitwisseling
Nucleobase uitwisseling werd waargenomen wanneer Na+AMP werd verwarmd gedurende 5 uur bij 90 ° C in zure waterige media met cytosine of guanine. Nucleobase-uitwisseling resulteerde in de vorming van nucleotide- (CMP of GMP), cyclische nucleotide- (cCMP of cGMP) en nucleoside- (cytidine of guanosine) structuren (zie supplementaire Figs. 96-102, en supplementaire Tabel 1 voor semi-kwantitatieve rendementen). In dit experiment, CMP en cytidine toonde een stijgende trend in intensiteit, terwijl cCMP een maximale intensiteit bereikt wanneer was 12,5 mM en vervolgens gedaald tot een intensiteit van 4,0 x 104 AU (Supplementary Figs. 102a en 155-158). Bij een cytosineconcentratie van 37,5 mM bleek de verbinding met de hogere intensiteit CMP te zijn en waren de intensiteiten gemeten voor cCMP en cytidine vrijwel gelijk. In de EIC’s van CMP en cCMP werden twee belangrijke isomere soorten waargenomen. In het geval van CMP werden +, + en + massa’s waargenomen, terwijl cCMP +, + en + binnen hun respectieve massaverdelingen vertoonde. In het geval van cytidine was + de belangrijkste gedetecteerde piek. Deze massaverdelingen kwamen overeen met die van de standaarden. De retentietijd van de belangrijkste isomeren kwam echter niet overeen met de canonieke CMP en cytidine. Wanneer AMP reageerde met toenemende concentraties guanine (supplementaire fig. 102b), bereikten alle drie glycosyleringsproducten (GMP, cGMP en guanosine) een maximumwaarde wanneer de concentratie guanine 2,5 mM bedroeg (supplementaire figs. 160-162). Deze resultaten waren het gevolg van de beperkte oplosbaarheid van guanine bij zure pH, zodat, zelfs als meer guanine aan het reactievat werd toegevoegd, de effectieve concentratie in de oplossing gelijk bleef. Na de maximumwaarde bleven de intensiteit van cGMP en guanosine constant, als gevolg van de slechte oplosbaarheid van guanine. Slechts een kleine toename van de intensiteit van alle drie guanineglycosyleringsproducten werd waargenomen wanneer = 37,5 mM, wat verband zou kunnen houden met een grotere aanwezigheid van guanine in de oplossing als gevolg van de hoge toegevoegde concentratie. In de EIC van GMP werd een breed gebied zonder goed gedefinieerde pieken waargenomen, hoewel twee hoofdpieken opvielen. + was de enige met guanineverbindingen verwante chemische stof die in de massaverdeling op de EIC werd waargenomen. Er werden vier in paren gegroepeerde pieken waargenomen wanneer de EIC van cGMP uit de MS-gegevens werd geëxtraheerd en de massadistributie + en +-soorten vertoonde. Anderzijds vertoonde de EIC van guanosine drie pieken, waarvan de meest intense de aanwezigheid van + in zijn massaverdeling liet zien.
De vorming van cytosine- en guanineglycosyleringsproducten toonde aan dat splitsing van de AMP-glycosidebinding onder onze reactieomstandigheden plaatsvond. Bij de analyse van de EIC’s van AMP, cAMP en adenosine werden in elk chromatogram verschillende pieken waargenomen, wat de theorie ondersteunt dat glycosidebindingen tijdens de dehydratatiereactie dynamisch hydrolyse/vorming ondergaan34. De reacties van cytosine en guanine nucleotiden met adenine werden eveneens onderzocht. In het geval van de dehydratatiereactie van CMP en adenine konden geen producten worden waargenomen die overeenkomen met nucleobase-uitwisseling (aanvullende Figs. 103-108/a). Bij de reactie van GMP met adenine werden echter duidelijk adenineglycosyleringsproducten gedetecteerd (aanvullende Figs. 105-108/b). Dit komt omdat de hydrolyse van glycosidebindingen in GMP gemakkelijker is dan voor CMP, onder dezelfde reactieomstandigheden34. Wij hebben ook de nucleobase-uitwisselingsreactie met UMP en adenine uitgevoerd, ter vergelijking met het directe pyrimidine-analoog van adenine (aanvullende Fig. 109). De resultaten kwamen meer overeen met de CMP-opbrengsten in supplementaire fig. 108, dan met de GMP-opbrengsten, waarbij een zeer lage opbrengst werd verkregen voor de adenineglycosyleringsproducten in de UMP-reactie, die niet voldoende is om detectie van AMP en cAMP mogelijk te maken.
Aminozuren effect op de distributie van glycosyleringsproducten
Zoals eerder vermeld, kunnen aminozuren, nucleotiden en hun bouwstenen tegelijkertijd op de vroege Aarde aanwezig zijn geweest. Daarom zouden producten van een copolymerisatiereactie, of zelfs producten die het gevolg zijn van een katalytisch effect van het ene type polymeer op het andere, in een prebiotische omgeving kunnen zijn ontstaan. Om de co-reactiviteit van nucleotide bouwstenen en aminozuren in een één-pot dehydratatie te bestuderen, werd glycine, het eenvoudigste aminozuur, opgenomen in de dehydratatiereacties van P-ribose en respectieve nucleobasen. De opname van glycine had een duidelijk effect op de vorming van glycosyleringsproducten, waardoor de totale opbrengst van producten met de massa van AMP-isomeren, cAMP-isomeren en adenosine (Fig. 4a en aanvullende Figs. 28-32) afnam. Dit wijst erop dat glycine een rol speelt bij ofwel het verbruiken van nucleotide-bouwstenen (P-ribose en/of adenine) via een nevenreactie, ofwel dat het aan de productstructuur wordt gehecht, waardoor de massa verandert. EIC-analyse voor deze reacties onthult pieken die overeenkomen met de massa van glycine-adducten (d.w.z. AMP-Gly, cAMP-Gly, adenosine-Gly en adenine-Gly) (supplementaire Figs. 115-122), hoewel deze nevenproducten niet in voldoende hoeveelheid worden gevormd om alle waargenomen veranderingen te verklaren. Glycine adducten werden ook bevestigd door gebruik te maken van gedutereerd glycine als startmateriaal samen met P-ribose en adenine, wat veranderingen veroorzaakte in de isotopische verdeling van de adduct massa’s (supplementaire Figs. 123, 124). Een maximale semi-kwantitatieve opbrengst van 59% werd verkregen voor de vorming van glycosyleringsproducten (AMP-isomeren, cyclische AMP-isomeren en adenosine) in de reactie van P-ribose en adenine; echter, slechts 46% opbrengst werd verkregen wanneer glycine ook aanwezig was in het reactiemedium (supplementaire Fig. 144). Het kwantificeren van de opbrengsten voor alle mogelijke afzonderlijke isomeren is technisch moeilijk, maar semi-kwantitatieve opbrengsten van sommige isomeren konden worden bepaald met behulp van zuivere standaarden: Adenosine 5′-monofosfaat en adenosine 2′,3′-cyclisch monofosfaat werden gevonden op 38,7% en 18,2%, respectievelijk, in afwezigheid van glycine, terwijl de opbrengst in aanwezigheid van glycine bleek aanzienlijk te zijn verlaagd (<2%) voor beide isomeren.
Glycine had ook invloed op de verdeling van isomere soorten, en er werden duidelijke verschillen waargenomen in vergelijking met het chromatogram van de basispiek (BPC) van de reactie van P-ribose en adenine, in aanwezigheid en afwezigheid van glycine (Fig. 4b en aanvullende Figs. 110-114). Deze gegevens wijzen op de aanwezigheid van verschillende chemische species en een daaruit voortvloeiende verandering in de massaverdeling tussen de reacties met en zonder glycine. Individuele EIC’s werden vervolgens geanalyseerd voor elk adenine-glycosyleringsproduct, waarbij duidelijke verschillen werden waargenomen in de relatieve piekintensiteiten wanneer glycine werd toegevoegd. Deze resultaten tonen duidelijk aan dat glycine een selectief effect heeft op welke isomere soorten bij voorkeur worden gevormd. Van glycine is bekend dat het onder dehydrerende omstandigheden gemakkelijk reageert met andere amines12 , en het is waarschijnlijk dat het reageert met de primaire amines van nucleobasen. Hybride nevenproducten inclusief glycine (Gly-AMP, Gly-cAMP, Gly-Adenosine, Gly-Adenine) werden gedetecteerd in ~1% opbrengst (Supplementary Fig. 145), maar dit kleine percentage heeft een belangrijk effect op de isomerische verdeling van de adenine glycosylatie producten (zie Supplementary Fig. 146, 147). Verandering in de isotopische verdeling van de massa’s van hybride producten werd gedetecteerd (Aanvullende Figs. 123, 124) wanneer gedutereerd glycine werd opgenomen in de dehydratatiereactie, wat de opname van glycine in hybride structuren bevestigt.
Een vergelijkbaar effect op de isomeerverdeling werd ook waargenomen wanneer P-ribose werd gereageerd met cytosine/guanine in de aanwezigheid van glycine (Fig. 4c, Aanvullende Figs. 125-140). De maximale intensiteiten van de verschillende isomeersoorten namen af (GMP, CMP, cGMP, cCMP, guanosine en cytidine), terwijl ook de verdeling van de relatieve intensiteiten werd beïnvloed. De verschillen tussen de experimenten werden nauwkeurig geverifieerd met behulp van een statistische methode zoals clusteranalyse van EIC-gegevens om de monsters, in aanwezigheid en afwezigheid van glycine, te segmenteren in samenstellende groepen/clusters met gemeenschappelijke kenmerken (Fig. 5). Het doel van de clusteranalyse in deze studie is de gegevens (d.w.z. nucleotide- en nucleosidestructuurvorming) te groeperen in samenstellende groepen met gemeenschappelijke kenmerken (b.v. toevoeging van glycine versus geen glycine). Deze analyse moet een hoge interne homogeniteit binnen clusters/groepen en een hoge externe heterogeniteit tussen clusters/groepen aantonen. Fig. 5 toont een dendrogram met “Wards”-koppeling35. Om de clusters in het dendrogram te identificeren, hebben wij de spectra gekleurd volgens de aanwezigheid van glycine (glycine – rood, geen glycine – zwart, blanco – blauw). Zoals kan worden waargenomen, clusteren glycine bevattende monsters samen. Eén cluster komt overeen met P-ribose + adenine + glycine (drie monsters), dat gescheiden is van monsters zonder glycine. Een tweede cluster komt overeen met P-ribose + guanine + glycine en P-ribose + cytosine + glycine. Monsters die adenine bevatten scheiden zich af in een grotere cluster die zich onderscheidt van de andere monsters, hetgeen duidt op een sterke invloed van adenine in de reactie. Er zijn namelijk een aantal andere mogelijke producten en reacties die onder de uitgevoerde reactieomstandigheden kunnen plaatsvinden (zie aanvullende noot 1 en aanvullende fig. 150-162 voor meer details).
Er werden ook andere aminozuren opgenomen in de dehydratatiereactie van adenine met P-ribose om te testen of zij ook enig effect zouden hebben op de isomerische distributie van de glycosyleringsproducten (Aanvullende Figs. 141-143). De zes voor deze studie geselecteerde aminozuren (arginine, glutaminezuur, threonine, methionine, fenylalanine en tryptofaan) hebben verschillende zijketens, met verschillende chemische aard en functionele groepen. Bij vergelijking van de resultaten met de gegevens verkregen uit de reactie van alleen P-ribose en adenine, werden in alle reacties veranderingen in de isomerische verdeling van AMP waargenomen, behalve in het geval van tryptofaan, wat toegeschreven zou kunnen worden aan conformationele beperkingen als gevolg van de aanwezigheid van de indool-gebaseerde zijketen van tryptofaan. Bij de analyse van de EIC’s van cAMP werden kleinere veranderingen in de relatieve intensiteit van de isomere pieken waargenomen. Er werd echter een duidelijk verschil waargenomen in de EIC van adenosine alleen voor de reacties met fenylalanine en threonine.