Simultaneous formation of glycosylation products
Powstanie struktur nukleozydowych i nukleotydowych z prostych prekursorów osiągnięto jednocześnie z trzema nukleobazami poprzez reakcje dehydratacji. Jest to sprzeczne z wcześniejszymi pracami w tej dziedzinie, gdzie warunki były optymalizowane w celu faworyzowania określonych produktów24,25,26. W typowym eksperymencie glikozylacji, adeninę i P-rybozę ogrzewano w temperaturze 90 °C przez 5 h przy pH 2,5. Zaobserwowaliśmy powstawanie nukleotydu monofosforanu adeniny (AMP) (i jego izomerów), gdy adenina i P-ryboza zostały połączone. Chromatogramy jonów ekstrahowanych (EIC) uzyskane z analizy HPLC-MS produktów ujawniły kilka pików o m/z zgodnych + i + (Rys. 13-15). Porównanie do wzorców potwierdziło, że AMP odpowiada pikowi znalezionemu przy RT = 4,2 min (Rys. 5, 6); inne główne piki mogą odpowiadać izomerom AMP, takim jak izomer N6-rybozylowany. W celu potwierdzenia tego faktu przeprowadzono reakcję hydrolizy w obecności NaOH (0,1 M), próbując rozróżnić różne izomery, biorąc pod uwagę, że izomer N6-rybozylowany jest bardziej podatny na hydrolizę. Jednakże, można zaobserwować niewielkie zaburzenia w pikach, co utrudnia potwierdzenie tożsamości izomeru N6-rybozylowanego. Następnie przeanalizowaliśmy dwa czyste standardy dwóch różnych izomerów (adenozyno-3′-monofosforan i adenozyno-5′-monofosforan monohydrat) indywidualnie i w mieszaninie w celu wyjaśnienia profilu elucji izomerów (ryc. 148, 149). Przesunięcie czasu retencji można zaobserwować dla mieszaniny wzorcowej, co zapewnia lepszą korelację z elucją tych związków w rzeczywistej próbce. Chociaż trudno jest rozróżnić izomery, możemy potwierdzić obecność co najmniej dwóch izomerów w produktach AMP poprzez porównanie profilu elucji mieszaniny wzorcowej z próbką rzeczywistą. Jest teraz jasne, że tworzenie się różnych izomerów (Supplementary Fig. 12) jest możliwą przyczyną elucji nukleotydów o tych samych masach w różnych czasach retencji. Ponadto, analiza MS/MS produktów naszej reakcji ujawnia fragmentację AMP (i jego izomerów) do adeniny (m/z = 136,0617 ± 0,01) (Supplementary Fig. 20); jest to zgodne z fragmentacją kanonicznego wzorca AMP. Proponowany przez nas mechanizm reakcji polega na tworzeniu wiązania glikozydowego pomiędzy grupą 1′-OH rybozy a grupą aminową adeniny (patrz Rys. 12 Suplementu).
Reakcje czasowe pokazują, że parowanie wody jest główną siłą napędową tworzenia produktów glikozylacji, wykazując znaczący wzrost tworzenia struktur nukleozydowych i nukleotydowych w przedziale czasowym pomiędzy 2 a 4 godziną (Rys. 2a). Odpowiada to zakresowi czasu, w którym objętość próbki drastycznie się zmniejsza, a odczynniki są ekstremalnie skoncentrowane. Po 5-6 h reakcji próbka osiąga suchość, a szybkość reakcji (a w ślad za nią intensywność w pomiarach HPLC-MS) stabilizuje się. Oprócz AMP, produkty zawierające wiązania glikozydowe, w tym cykliczne nukleotydy (tj. cAMP)27 i nukleozydy (tj. adenozyna), wykrywano przy użyciu RP-HPLC-MS, MS/MS i badano pod kątem tworzenia pochodnych 1,N6-etenowych28,29, co potwierdzono porównaniem ze standardami (Rys. 2, Rys. uzupełniające 7-11, Rys. uzupełniające 23-27). Czasy retencji wzorców kanonicznych 2′,3′-cAMP i 3′,5′-cAMP nie odpowiadały czasom retencji pików EIC w próbce. Jednakże rozkłady mas (+; +) i wzory fragmentacji (+) były identyczne (Rys. 16-21). Wyniki te wskazują, że podczas tworzenia się struktur cyklicznych, kanoniczny cAMP nie jest głównym produktem. Porównanie do standardu analitycznego adenozyny również pokazuje, że adenozyna, wraz z szeregiem izomerycznych gatunków, powstaje w reakcji kondensacji P-rybozy i adeniny (Rysunki uzupełniające 18-22). Podczas gdy kanoniczne formy AMP i adenozyny zostały potwierdzone w tych eksperymentach, nie były one głównymi produktami w reakcji dehydratacji.
Gdy fosforan dostarczono oddzielnie jako pirofosforan i reagowano z adeniną i rybozą, wykryto związek o masie adenozyny i wykryto niewielką ilość AMP i cAMP, a adenozyna nadal tworzyła się, gdy nie było źródła fosforanu (Rys. Uzupełniające 33-41). Warto zauważyć, że celowo skupiliśmy się w naszych badaniach na identyfikacji produktów fosforylowanych (izomerów AMP i izomerów cAMP), a mniej uwagi poświęciliśmy identyfikacji produktów fosforylowanych, które nie są izomerami AMP i izomerami cAMP30,31,32. Proponujemy utworzenie wiązania glikozydowego między grupą hydroksylową rybozy i grupą aminową adeniny, które jest wyzwalane przez utratę cząsteczki wody przez odparowanie. Względna reaktywność pierwszo- i drugorzędowych grup aminowych w adeninie jest dobrze zbadana33 i bez aktywacji lub obecności grupy ochronnej, wiązanie glikozydowe przy pierwszorzędowej aminie jest zwykle preferowane. Dlatego nie oczekuje się, że kanoniczny izomer adenozyny/AMP będzie głównym produktem, ponieważ wymagałby reakcji wyłącznie przy drugorzędowej aminie. Jednakże, reaktywność jest wystarczająco wysoka w miejscu drugorzędowej aminy, aby mogły powstawać kanoniczne izomery, chociaż nie jako główny produkt. W innych nukleobazach, takich jak guanina, jest jeszcze więcej dostępnych grup aminowych i potencjał do tworzenia izomerycznych produktów jest większy. Reaktywność rybozy jest prawdopodobnie głównie przez pozycję anomeryczną, co prowadzi do mniejszej liczby możliwych izomerów, chociaż niektóre inne drobne produkty mogą być obserwowane.
Reaktywność innych kanonicznych nukleobaz (cytozyny, guaniny i tyminy) z P-rybozy została również zbadana. Wykryto masy odpowiadające strukturom nukleozydowym i nukleotydowym po reakcji dehydratacji guaniny i cytozyny z P-rybozą (Rys. 3 i Rys. 50-64). Struktury glikozylacji guaniny tworzyły się w stosunkowo niewielkim stopniu, prawdopodobnie ze względu na ograniczoną rozpuszczalność guaniny w niskim pH. Ilości produktów zmierzone dla monofosforanu 5-metylurydyny (m5UMP) i 5-metylurydyny (nukleozyd tyminy) były nawet niższe niż ich odpowiedniki z guaniny i cytozyny (ryc. 3 i ryc. 65, 66). Wyniki te można wytłumaczyć obecnością pierwszorzędowej grupy aminowej w guaninie i cytozynie, której brak w tyminie. Podczas gdy wszystkie trzy nukleobazy posiadają drugorzędowe grupy aminowe, są one mniej reaktywne w tworzeniu wiązań glikozydowych. Stąd tworzenie struktur nukleozydowych i nukleotydowych w wyniku reakcji z aminami drugorzędowymi, co jest wymagane do tworzenia kanonicznych produktów glikozylacji, jest niekorzystne w przypadku nukleobaz, w których dostępne są aminy pierwszorzędowe. Ma to interesującą implikację dla przyjęcia chemii kwasów nukleinowych w pochodzeniu życia, ponieważ sugeruje, że kanoniczne nukleotydy mogły być początkowo nieodpowiednie, dopóki nie pojawiły się dalsze mechanizmy biochemiczne zwiększające selektywność w kierunku właściwych izomerów. Dlatego, zgodnie z oczekiwaniami, podczas gdy kanoniczne produkty nukleotydowe i nukleozydowe cytozyny i guaniny powstawały w naszych eksperymentach, nie odpowiadały one głównym obserwowanym pikom (Rys. 42-49). Łącząc te dwie obserwacje (różne czasy retencji, ale taki sam rozkład mas jak kanoniczne wzorce w EIC), możemy stwierdzić, że gatunki nukleotydów i nukleozydów powstałe w wyniku reakcji dehydratacji guaniny/cytozyny z P-rybozą były głównie izomerycznymi gatunkami kanonicznych nukleotydów i nukleozydów (niektóre możliwe struktury pokazano na Rysunkach Uzupełniających. 50, 51).
Typowo, tworzenie struktur nukleotydowych przeprowadzano w specyficznych warunkach w zależności od użytej nukleobazy, celując w konkretny produkt reakcji. W alternatywnym podejściu zdecydowaliśmy się na jednoczesne włączenie wielu nukleobaz do reakcji z P-rybozą. Naszym celem było określenie, czy tworzenie produktów z udziałem wielu nukleobaz w tych samych warunkach reakcji będzie dawało mieszaninę produktów, czy też będzie zdominowane przez jeden z nich. Reakcję tę prowadzono włączając jednocześnie do naczynia reakcyjnego dwie lub trzy nukleobazy (adeninę, guaninę i cytozynę) wraz z P-rybozą. Otrzymywano mieszaninę produktów glikozylacji, w skład której wchodziły nukleotydy (AMP, GMP i CMP) oraz odpowiednie cykliczne produkty nukleotydowe (cAMP, cGMP i cCMP) i nukleozydowe (adenozyna, guanozyna i cytydyna) (ryc. 67-95). Produkty glikozylacji guaniny powstawały z mniejszą wydajnością niż produkty adeniny i cytozyny, jak oczekiwano z powodu niskiej rozpuszczalności guaniny w warunkach kwaśnych.
Wymiana nukleobazowa
Wymianę nukleobazową obserwowano, gdy Na+AMP ogrzewano przez 5 h w temperaturze 90 °C w kwaśnym środowisku wodnym z cytozyną lub guaniną. Wymiana nukleobazowa powodowała powstawanie struktur nukleotydowych (CMP lub GMP), cyklicznych nukleotydowych (cCMP lub cGMP) i nukleozydowych (cytydyna lub guanozyna) (patrz Rys. 96-102 Suplementu i Tabela 1 Suplementu dla półilościowych wyników). W tym eksperymencie CMP i cytydyna wykazywały tendencję wzrostową w intensywności, podczas gdy cCMP osiągała maksymalną intensywność przy stężeniu 12,5 mM, a następnie spadała aż do intensywności 4,0 × 104 AU (Rys. 102a i 155-158). Przy stężeniu cytozyny 37,5 mM, związkiem o większej intensywności okazał się CMP, a intensywności zmierzone dla cCMP i cytozyny były prawie takie same. W EICs CMP i cCMP zaobserwowano dwa główne gatunki izomeryczne. W przypadku CMP wykryto masy +, + i +, podczas gdy cCMP wykazywał +, + i + w ich odpowiednich rozkładach mas. W przypadku cytydyny, + był głównym wykrytym pikiem. Te rozkłady mas odpowiadały rozkładom obserwowanym we wzorcach. Jednakże, czas retencji głównych izomerów nie odpowiadał kanonicznemu CMP i cytydynie. Gdy AMP reagował ze wzrastającym stężeniem guaniny (Supplementary Fig. 102b), wszystkie trzy produkty glikozylacji (GMP, cGMP i guanozyna) osiągnęły maksymalną wartość, gdy stężenie guaniny wynosiło 2,5 mM (Supplementary Fig. 160-162). Wyniki te były konsekwencją ograniczonej rozpuszczalności guaniny w kwaśnym pH, dlatego nawet po dodaniu większej ilości guaniny do naczynia reakcyjnego, efektywne stężenie w roztworze było takie samo. Po osiągnięciu wartości maksymalnej, intensywność cGMP i guanozyny była stała, co wynikało ze słabej rozpuszczalności guaniny. Obserwowano jedynie niewielki wzrost intensywności wszystkich trzech produktów glikozylacji guaniny przy stężeniu = 37,5 mM, co może być związane z większą obecnością guaniny w roztworze na skutek dodanego wysokiego stężenia. W EIC GMP zaobserwowano szeroki obszar bez dobrze zdefiniowanych pików, choć wyróżniały się dwa główne piki. + był jedynym gatunkiem chemicznym, związanym ze związkami guaniny, wykrytym w rozkładzie masy na jego EIC. Cztery piki, zgrupowane w pary, zaobserwowano, gdy EIC cGMP został wyodrębniony z danych MS, a rozkład mas wskazywał na gatunki + i +. Z drugiej strony, EIC guanozyny prezentował trzy piki, z których najintensywniejszy wskazywał na obecność + w jego rozkładzie masowym.
Powstanie produktów glikozylacji cytozyny i guaniny wykazało, że rozszczepienie wiązania glikozydowego AMP nastąpiło w naszych warunkach reakcji. Podczas analizy EIC AMP, cAMP i adenozyny zaobserwowano kilka pików na każdym chromatogramie, co potwierdza teorię, że wiązania glikozydowe ulegają dynamicznej hydrolizie/formacji podczas reakcji dehydratacji34. Zbadano również reakcje nukleotydów cytozyny i guaniny z adeniną. W przypadku reakcji dehydratacji CMP i adeniny nie zaobserwowano produktów odpowiadających wymianie nukleobazowej (Rys. 103-108/a). Natomiast produkty glikozylacji adeniny zostały wyraźnie wykryte w reakcji GMP z adeniną (ryc. 105-108/b). Wynika to z faktu, że hydroliza wiązań glikozydowych w GMP jest łatwiejsza niż w przypadku CMP, w tych samych warunkach reakcji34. Przeprowadziliśmy również reakcję wymiany nukleobaz z UMP i adeniną, w celu porównania z bezpośrednim pirymidynowym analogiem adeniny (Suplementary Fig. 109). Wyniki były bardziej zbliżone do wydajności CMP przedstawionych na Supplementary Fig. 108, niż do wydajności GMP, uzyskując bardzo niską wydajność produktów glikozylacji adeniny w reakcji UMP, niewystarczającą do umożliwienia detekcji AMP i cAMP.
Wpływ aminokwasów na dystrybucję produktów glikozylacji
Jak już wcześniej wspomniano, aminokwasy, nukleotydy i ich elementy budulcowe mogły być obecne na wczesnej Ziemi w tym samym czasie. Dlatego w środowisku prebiotycznym mogły powstawać produkty reakcji kopolimeryzacji, a nawet produkty wynikające z jakiegoś katalitycznego działania jednego typu polimeru nad drugim. Aby zbadać współreaktywność nukleotydowych bloków budulcowych i aminokwasów w reakcji dehydratacji w jednym miejscu, do reakcji dehydratacji P-rybozy i odpowiednich nukleobaz włączono glicynę, najprostszy aminokwas. Włączenie glicyny miało wyraźny wpływ na powstawanie produktów glikozylacji, powodując zmniejszenie ogólnej wydajności produktów o masie izomerów AMP, izomerów cAMP i adenozyny (Rys. 4a i Rys. 28-32). Wskazuje to, że glicyna odgrywa rolę albo w zużywaniu nukleotydowych bloków budulcowych (P-rybozy i/lub adeniny) na drodze reakcji ubocznej, albo że przyłącza się do struktury produktu, zmieniając jego masę. Analiza EIC dla tych reakcji ujawnia piki odpowiadające masie adduktów glicyny (tj. AMP-Gly, cAMP-Gly, adenozyna-Gly i adenina-Gly) (Supplementary Figs. 115-122), chociaż te produkty uboczne nie są tworzone w wystarczającej ilości, aby odpowiadać za wszystkie obserwowane zmiany. Addukty glicyny potwierdzono również stosując deuterowaną glicynę jako materiał wyjściowy wraz z P-rybozą i adeniną, co powodowało zmiany w rozkładzie izotopowym mas adduktów (Suplementary Fig. 123, 124). Maksymalną wydajność półilościową 59% uzyskano dla tworzenia produktów glikozylacji (izomerów AMP, cyklicznych izomerów AMP i adenozyny) w reakcji P-rybozy i adeniny, jednak tylko 46% wydajności uzyskano, gdy w medium reakcyjnym obecna była również glicyna (Supplementary Fig. 144). Ilościowe określenie wydajności dla wszystkich możliwych poszczególnych izomerów jest technicznie trudne, ale półilościowe wydajności niektórych izomerów mogły być określone przy użyciu czystych wzorców: 5′-monofosforan adenozyny i 2′,3′-cykliczny monofosforan adenozyny stwierdzono na poziomie odpowiednio 38,7% i 18,2% w nieobecności glicyny, natomiast wydajność w obecności glicyny okazała się znacznie obniżona (<2%) dla obu izomerów.
Glicyna wpłynęła również na dystrybucję izomerycznych gatunków, a wyraźne różnice zaobserwowano w porównaniu z chromatogramem piku podstawowego (BPC) z reakcji P-rybozy i adeniny, w obecności i nieobecności glicyny (Rys. 4b i Rys. uzupełniające 110-114). Dane te wskazują na obecność różnych gatunków chemicznych i wynikającą z tego zmianę w rozkładzie masy pomiędzy reakcjami z glicyną i bez glicyny. Następnie przeanalizowano poszczególne EIC dla każdego produktu glikozylacji adeniny, w wyniku czego zaobserwowano wyraźne różnice we względnych intensywnościach pików po dodaniu glicyny. Wyniki te jasno pokazują, że glicyna ma selektywny wpływ na to, które z izomerów są preferencyjnie tworzone. Wiadomo, że glicyna łatwo reaguje z innymi aminami w warunkach dehydratacji12 i prawdopodobnie reaguje z pierwszorzędowymi aminami nukleobaz. Hybrydowe produkty uboczne zawierające glicynę (Gly-AMP, Gly-cAMP, Gly-Adenosine, Gly-Adenine) wykryto z wydajnością ~1% (ryc. 145), jednak ten niewielki odsetek ma istotny wpływ na rozkład izomeryczny produktów glikozylacji adeniny (patrz ryc. 146, 147). Zmiana rozkładu izotopowego mas produktów hybrydowych została wykryta (Rys. 123, 124), gdy do reakcji dehydratacji włączono deuterowaną glicynę, co potwierdza włączenie glicyny do struktur hybrydowych.
Podobny wpływ na rozkład izomerów zaobserwowano również, gdy P-rybozę poddano reakcji z cytozyną/guaniną w obecności glicyny (Rys. 4c, Rys. 125-140). Zmniejszeniu uległy maksymalne intensywności poszczególnych izomerów (GMP, CMP, cGMP, cCMP, guanozyny i cytydyny), a także rozkład względnych intensywności. Różnice pomiędzy eksperymentami zostały dokładnie zweryfikowane przy użyciu metody statystycznej, jaką jest analiza skupień danych EIC, w celu podzielenia próbek, w obecności i nieobecności glicyny, na grupy/klastry składowe o wspólnych cechach (Rys. 5). Celem analizy skupień w tym badaniu jest pogrupowanie danych (tj. tworzenie struktury nukleotydów i nukleozydów) w zespoły składowe o wspólnych cechach (np. dodatek glicyny versus brak glicyny). Analiza ta powinna wykazać wysoką homogeniczność wewnętrzną w obrębie skupisk/grup i wysoką heterogeniczność zewnętrzną pomiędzy skupiskami/grupami. Na Rys. 5 przedstawiono dendrogram z powiązaniami typu „Wards „35. Aby zidentyfikować klastry w dendrogramie, pokolorowaliśmy widma w zależności od obecności glicyny (glicyna – czerwony, brak glicyny – czarny, puste – niebieski). Jak można zaobserwować, próbki zawierające glicynę grupują się razem. Jedno skupisko odpowiada P-rybozie + adeninie + glicynie (trzy próbki), które jest oddzielone od próbek bez glicyny. Drugie skupisko odpowiada P-rybozie + guaninie + glicynie i P-rybozie + cytozynie + glicynie. Próbki zawierające adeninę rozdzielają się w większe skupisko, które odróżnia się od pozostałych próbek, wskazując na silny wpływ adeniny w reakcji. Rzeczywiście, istnieje wiele innych możliwych produktów i reakcji, które mogą zachodzić w warunkach przeprowadzonej reakcji (patrz Uzupełniająca uwaga 1 i Uzupełniające ryciny 150-162 dla więcej szczegółów).
Inne aminokwasy zostały również włączone do reakcji dehydratacji adeniny z P-rybozą, aby sprawdzić, czy miałyby one również jakiś wpływ na rozkład izomeryczny produktów glikozylacji (Rys. Uzupełniające 141-143). Sześć aminokwasów wybranych do tego badania (arginina, kwas glutaminowy, treonina, metionina, fenyloalanina i tryptofan) ma różne łańcuchy boczne, o różnej naturze chemicznej i grupach funkcyjnych. Porównując uzyskane wyniki z danymi otrzymanymi z reakcji tylko P-rybozy i adeniny, zaobserwowano zmiany w rozkładzie izomerycznym AMP we wszystkich reakcjach, z wyjątkiem tryptofanu, co można przypisać ograniczeniom konformacyjnym wynikającym z obecności indolowego łańcucha bocznego tryptofanu. Analizując EIC cAMP zauważono mniejsze zmiany we względnej intensywności pików izomerycznych. Natomiast wyraźną różnicę w EIC adenozyny zaobserwowano tylko dla reakcji z udziałem fenyloalaniny i treoniny.