Macacii sunt cele mai răspândite primate neumane, cuprinzând mai mult de 20 de specii care au deviat unele față de altele în urmă cu până la 5-6 milioane de ani2. Genul Macaca este strâns înrudit cu oamenii, împărtășind un ultim strămoș comun ∼25 milioane de ani în urmă3. Relația strânsă dintre oameni și macaci a făcut ca mai multe specii să devină atractive ca modele animale pentru diferite analize biomedicale. Deși subspecia indiană de macac rhesus (Macaca mulatta mulatta) a fost inițial modelul de cercetare preferat, o interdicție privind exportul acestui macac a redus foarte mult disponibilitatea acestor animale, ceea ce a dus la o utilizare sporită a altor specii și/sau subspecii de macaci, în special macacul rhesus chinezesc (CR) (Macaca mulatta lasiota) și macacul cynomolgus sau macacul mâncător de crabi (CE) (Macaca fascicularis).

Am secvențiat genomurile unei femele de macac CR și a unei femele de macac CE folosind o strategie de tip „whole-genome shotgun” pe o platformă de secvențiere de generație următoare. Pe scurt, analiza secvenței genomului mitocondrial a verificat originea prezisă a ambilor indivizi (secțiunea suplimentară 1). Am construit apoi 19 și 18 biblioteci de ADN genomic multiple împerecheate cu dimensiuni de inserție care cresc treptat pentru macacul CR și, respectiv, macacul CE. Dimensiunea totală a genomului asamblat al macacului CR și al macacului CE a fost, în medie, de ∼2,84 Gb și, respectiv, 2,85 Gb, oferind o acoperire de 47 și, respectiv, 54 de ori (tabelul 1 și secțiunea suplimentară 1). Schemele au fost atribuite pe cromozomi în funcție de sintenia afișată cu secvențele genomului macacului indian rhesus (IR)4 și uman. Aproximativ 97% din schelele macacilor CR și 92% din schelele macacilor CE au putut fi plasate pe cromozomi. Am aplicat, de asemenea, RNA-seq pentru a trasa profilul transcriptelor în diferite țesuturi de la un macac IR și doi macaci CE (Metode online). O analiză integrată care combină datele genomice și transcriptomice a fost apoi utilizată pentru a defini structura transcriptelor și pentru a stabili profilul de expresie al fiecărei gene (Secțiunea suplimentară 2).

Tabelul 1 Secvențierea genomului și statisticile de asamblare

Diversitatea genetică a macacilor a fost evaluată prin compararea genomului întreg și alinierea citirilor scurte utilizând genomul macacilor IR ca referință. În total, am detectat >20 de milioane de diferențe de un singur nucleotid și 740.827 de evenimente indel în cele trei specii sau subspecii de macaci (secțiunea suplimentară 3), ceea ce va oferi o eterogenitate genetică abundentă pentru utilizare în viitoarele aplicații și analize biomedicale. Am clasificat toate situsurile variabile cu un singur nucleotid în trei clase (variante partajate, fixe și unice) pe baza prezenței sau absenței lor la cei trei indivizi (Fig. 1a). Variantele unice au reprezentat >71,7 % din totalul variantelor, ceea ce nu este surprinzător, având în vedere că, chiar și în cadrul unei populații panmictice, se așteaptă ca 44 % dintre alele să fie singletone într-un eșantion de trei indivizi. Este demn de remarcat faptul că un număr mare de diferențe genetice au fost împărtășite între cel puțin doi macaci. Utilizând doar variațiile fixe și unice, am estimat că cea mai mare rată de divergență, 0,40 %, a fost între macacul CE și macacul IR (Fig. 1b). Cu toate acestea, divergența de secvență dintre macacul CE și macacul CR (0,34%), deși nominal specii diferite, a fost apropiată de cea observată între subspecii, macacul CR și macacul IR (0,31%).

Figura 1: Divergența nucleotidelor unice între speciile/subspecii de macaci.

(a) Clasificarea divergenței nucleotidelor unice între speciile de macaci. Cele ∼20 de milioane de diferențe de nucleotide unice între macaci au fost clasificate în trei subclase. Regiunile care se suprapun reprezintă variante heterozigote împărtășite între doi indivizi sau între toți indivizii. U, variații heterozigote unice evidente în fiecare specie; F, numărul de variații homozigote fixe în fiecare specie. (b) Divergența nucleotidelor unice între speciile de macaci în ferestre de 100-kb în întregul genom. Variantele heterozigote au fost ignorate în acest calcul. Divergența cromozomilor X între cele două subspecii de macaci rhesus a fost o valoare aberantă semnificativă (P < 0,05, testul Grubbs’). CE, macac mâncător de crabi; CR, macac chinezesc rhesus; IR, macac indian rhesus.

Cercetarea recentă bazată pe date limitate de secvență a sugerat că o introgresie străveche ar fi putut avea loc de la macacii CR la macacii CE care trăiesc într-o zonă de distribuție geografică suprapusă în peninsula Indo-Chineză5,6,7. Cele două genomuri secvențiate ne-au permis să cuantificăm influența acestei introgresiuni la nivelul întregului genom. În mod specific, am explorat dacă în genomul macacilor CR și al macacilor CE a apărut un semnal ADN compatibil cu hibridizarea interspecii. Am calculat raportul de divergență dintre macacul CE și macacul CR și l-am comparat cu raportul de divergență dintre macacul CR și macacul IR pentru ferestre de 50-kb în genomurile aliniate (secțiunea suplimentară 4). Pentru aceste calcule, am ignorat variațiile la situsurile CpG, deoarece se știe că acestea evoluează deosebit de rapid. Peste 27 % din ferestre au prezentat un raport de divergență mai mic de zero, ceea ce sugerează că macacii CE și CR sunt mai strâns înrudiți decât macacii din subspecia CR și IR în aceste regiuni (secțiunea suplimentară 4). În plus, >93% din ferestrele genomice de 50-kb au prezentat o rată de divergență mai mică între macacii CE și CR în comparație cu macacii CE și IR. Prin urmare, polimorfismele ancestrale nesortate nu ar putea explica în întregime proporția ridicată de regiuni inconsecvente observate între macacii CE și macacii CR. Mai mult decât atât, prin combinarea datelor anterioare privind polimorfismele de nucleotide unice (SNP) din populațiile de macaci IR și CR cu datele obținute de la indivizii noștri de macaci CR și CE secvențiați8 , am observat că individul nostru de macac CE s-a grupat în cadrul populației de macaci CR (secțiunea suplimentară 4). Acest lucru susține apariția unui flux genetic puternic de la genomul macacilor CR la cel al macacilor CE. Prin examinarea gradului de asimetrie în divergența dintre macacul CE și macacul CR și dintre macacul CE și macacul IR, am estimat că ∼30% din genomul macacului CE este de origine macacică CR (Secțiunea suplimentară 4).

Am căutat în continuare să identificăm regiuni de introgresie putativă (PIR) în genomul macacului CE la care ar fi putut contribui fluxul genetic. Am folosit date simulate (în cadrul unui model neutru fără migrație) ca un control (Metode online și Secțiunea suplimentară 4) și am identificat 8.942 de PIR-uri care se întind pe 778 Mb cu o rată de divergență substanțial mai mică decât cea așteptată între macacul CE și macacul CR (Fig. 2a,b). După fuzionarea PIR-urilor care se suprapun, am constatat că majoritatea PIR-urilor (>98%) au fost mai scurte de 500 kb. Deoarece distribuția lungimii PIR-urilor este o funcție a timpului scurs de când a avut loc fluxul genetic9, prevalența PIR-urilor scurte sugerează că fluxul genetic a avut loc de-a lungul unei perioade extinse de timp evolutiv și este puțin probabil să fi fost pur și simplu o consecință a unui flux genetic foarte recent mediat de om. De asemenea, am observat o diferență marcantă de variabilitate între cromozomul X și cromozomul autosomal (secțiunea suplimentară 4), care ar fi putut rezulta din fluxul genetic determinat de bărbați. Un factor care contribuie probabil la fluxul genetic restrâns de la femelele de macac CR la masculii de macac CE este faptul că femelele de macac CR prezintă o sezonalitate ovariană marcată și copulează numai în timpul ovulației, în timp ce femelele de macac CE nu prezintă o sezonalitate reproductivă distinctă și rămân receptive sexual pe tot parcursul anului10. În plus, având în vedere că dispersia este determinată în primul rând de masculi la macaci din cauza filopatriei femelelor, acest lucru ar putea explica, de asemenea, fluxul genetic de la masculii de macaci CR la femelele de macaci CE și absența fluxului invers. Prin urmare, aceste populații pot fi de interes pentru studierea aspectelor fiziologice și comportamentale ale reproducerii între diferite specii.

Figura 2: Rata de divergență și regiunile de baleiaj selectiv.

(a) Distanța genetică dintre macaci (curba albastră), om și macaci (curba roșie), și distanța dintre speciile/subspecii de macaci (curba verde pentru IR și CR; curba galbenă pentru CR și CE) de-a lungul cromozomului 14. Linia roșie punctată descrie distanța genetică medie dintre om și macac. Linia albastră punctată reprezintă distanța genetică medie între macaci. Barele roșii din partea de jos denotă regiunile candidate de baleiaj selectiv, iar barele albastre denotă regiunile de introgresie putativă. Regiunile consecutive care conțin zero mutații în toate speciile (cum ar fi regiunea ∼20 Mb) sunt regiuni de decalaj de secvențiere sau regiuni de decalaj de aliniere. (b) O regiune de introgresie potențială (umbrită în albastru), care conține mai puține variații între macacul CE și macacul CR decât între cei doi macaci rhesus (macacul IR și macacul CR). (c) O regiune de baleiaj selectiv, cuprinzând 400 kb, care conține o singură genă. Bara roșie denotă regiunea codificatoare a genei SBF2; caseta umbrită cu roșu corespunde întinderii presupusei „măturaturi selective”.

Selecția puternică în favoarea unor noi alele avantajoase are ca rezultat o „măturare selectivă” care reduce diversitatea genetică în raport cu regiunile neselectate. Am dezvoltat un algoritm pentru a identifica regiunile putative de măturare care conțin variație redusă între cele trei specii/subspecii de macaci și am generat date simulate în ipoteza unui model neutru pentru a evalua semnificația sa statistică (Online Methods și secțiunea suplimentară 5). Am identificat 217 regiuni de măturare puternic selective care prezentau un nivel redus de variație între macaci și care se abăteau substanțial de la așteptările neutre (Fig. 2c, Secțiunea suplimentară 5 și Tabelul suplimentar 17). În mod special, una dintre cele mai mari zece regiuni de baleiaj selectiv, situată pe cromozomul 14 al macacilor, conține doar o singură genă, factorul de legare SET 2 (SBF2) (Fig. 2c). Astfel, este probabil ca această genă, care codifică o proteină membranară periferică din familia protein-tyrosine fosfatazelor, să fi fost ținta unei selecții pozitive în timpul evoluției timpurii a macacilor. De un potențial interes biomedical, defectele în ortologul SBF2 uman cauzează o formă demielinizantă autozomal recesivă a bolii Charcot-Marie-Tooth (CMT4B2).

Pentru a dezvălui țintele potențiale ale selecției pozitive în fiecare ramură de macac, am atribuit 14.978 de ortologi de gene 1:1 pentru om, cimpanzeu și cele trei specii/subspecii de macaci prin alinierea genomului (Secțiunea suplimentară 6). Compararea trio-urilor de ortologi ai macacilor a arătat că aceștia au în comun un nivel extrem de ridicat de similaritate a secvenței de nucleotide în cadrul regiunilor genice. Este demn de remarcat faptul că 20,7 % dintre ortologi prezintă un grad mai mare de similitudine între macacii CR și macacii CE decât între macacii CR și macacii IR, ceea ce poate implica influența introgresiunii. Comparația categoriilor de gene pe baza ontologiei genetice între liniile Macaca, Hominid și Murid a indicat faptul că procesele bazate pe microtubuli și calea de semnalizare a receptorului de insulină au evoluat deosebit de rapid în linia Macaca (secțiunea suplimentară 6). Testele raportului de verosimilitate bazate pe un model al locului de ramificare au evidențiat 16 gene selectate pozitiv în mod specific în ramura macacilor IR, 7 în ramura macacilor CR și 13 în ramura macacilor CE (secțiunea suplimentară 6). Este intrigant faptul că 31 dintre cele 36 de gene selectate pozitiv la macaci codifică proteine de legare care joacă roluri importante în reglarea expresiei genice. De asemenea, este demn de remarcat faptul că două gene care codifică proteine ale dendritelor, CLCN2 în ramura macacilor IR și proteina asociată citoscheletului (ARC), reglată de activitate, în ramura macacilor CE, au cunoscut o selecție pozitivă. Aceste două gene, împreună cu alte cinci gene selectate pozitiv, sunt deja cunoscute ca fiind relevante pentru bolile genetice umane, ceea ce indică importanța probabilă a funcțiilor lor biologice.

Disponibilitatea secvențelor genomului macacilor CR și CE ne-a permis să evaluăm diversitatea lor genetică, precum și diferențele genetice dintre macaci și oameni, ceea ce este important având în vedere utilizarea proeminentă a macacilor în cercetarea biomedicală. Comparațiile dintre genomurile macacilor au evidențiat absența a 25 de gene umane cu o singură copie (Metode online și secțiunea suplimentară 6), inclusiv o genă a receptorului de chemokine, IL32, care poate juca un rol atât în răspunsurile imune înnăscute, cât și în cele adaptative, și, prin urmare, este important de luat în considerare atunci când acești macaci sunt utilizați în studiile privind bolile infecțioase. În plus, un total de 170 de gene legate de boli sau de imunitate la una sau alta dintre speciile de macaci conțin fie mutații frameshift, fie codoni de oprire prematură, ceea ce ar fi prezis a fi pseudogenizat aceste gene (Secțiunea suplimentară 6). Autenticitatea acestor mutații de trunchiere este susținută atât de datele de transcriptom și de citirile de secvențiere de mare profunzime, cât și de validarea PCR independentă. Treizeci și două dintre aceste gene funcționează în căile imunității și par să fi fost pierdute la macaci. De exemplu, o genă importantă a imunității înnăscute, DEFA4, care codifică una dintre peptidele microbicide și citotoxice produse de neutrofile11, a fost pseudogenizată la toți cei trei macaci din cauza pierderii primului său exon. Mai mult, gena receptorului Toll-like 4 (TLR4) conținea o deleție de 1-bp, care generează un codon de oprire prematură în cel de-al treilea exon al său la toți cei trei macaci (secțiunea suplimentară 6). S-a raportat că TLR4 a fost supus unei selecții pozitive la primatele din Lumea Veche12. În mod notabil, unele gene legate de bolile umane conțin, de asemenea, modificări de cadru în omologii lor din macaci. De exemplu, am constatat că toți cei trei macaci aveau un codon de oprire prematură în cel de-al doilea exon al genei receptorului opioid mu1 (OPRM1), care codifică o proteină distribuită în tot neuraxisul și sistemul nervos periferic și care este ținta principală a opioidelor13 (Secțiunea suplimentară 6).

Am investigat, de asemenea, diferențele genetice în ortologii care sunt în mod specific importante în studiile biomedicale. Proteina citoplasmatică tripartite-motiv 5α (codificată de gena TRIM5), care poate restricționa replicarea unei game largi de retrovirusuri, este un biomarker cheie utilizat pentru a selecta modele animale de infecție cu HIV14. Pentru a studia diversitatea genetică a TRIM5 la nivelul întregii populații, am amplificat prin PCR și am secvențiat TRIM5 de la 33 de indivizi macaci CE de origine vietnameză fără legătură între ei și de la 28 de indivizi macaci CR (Metode online). Nu am detectat o chimeră Trim5-ciclofilină A (TRIM-CypA2) raportată anterior15 la niciun individ, sugerând că acest genotip este rar în aceste populații. Cu toate acestea, 19 polimorfisme nesinonime și o microdeleție au fost identificate în gena TRIM5 în raport cu referința macacilor IR; aproape toate aceste polimorfisme au prezentat frecvențe diferite între cele două populații (Fig. 3 și secțiunea suplimentară 7). Am identificat, de asemenea, o deleție de 6-bp în gena TRIM5 la macacul CE, care duce la pierderea a doi aminoacizi (Thr339 și Phe340). Cercetări recente au indicat faptul că deleția acestor reziduuri ar putea duce la creșterea patogenității HIV sau SIV16. O frecvență ridicată (97,5 %) a acestei mutații a fost detectată în populația de macaci CE, ceea ce indică faptul că această deleție a devenit practic fixă la macacul CE. În schimb, în populația de macaci CR, frecvența acestei mutații este de aproximativ 50%, doar marginal mai mare decât în populația de macaci IR (36%)17. Variația frecvenței acestei deleții de 6-bp și a altor polimorfisme între macacii de origini geografice diferite ar putea fi responsabilă pentru diferențele observate în ceea ce privește rezistența la HIV între aceste specii/subspecii de macaci16. Am studiat, de asemenea, variația genetică în alte gene legate de boală în aceeași populație de macaci CE sau CR, observând că mutațiile apar adesea la frecvențe diferite în cele două specii (secțiunea suplimentară 7).

Figura 3: Studiul populațional al genei TRIM5 în populațiile de macaci CR și macaci CE.

(a) Schema proteinei codificate de TRIM5 la macaci. Domeniile funcționale adnotate sunt marcate cu numele domeniilor din casetele colorate. Sunt marcate pozițiile polimorfismelor nesinonime și ale deleției de doi aminoacizi (în roșu).(b) Frecvențele tuturor polimorfismelor nesinonime și ale deleției de doi aminoacizi în populațiile de macaci CR și macaci CE. Frecvența este socotită pentru genotipul care apare în referința macacilor IR.

Pentru a studia ortologii domeniilor proteice umane care pot fi utilizate ca medicamente la macaci și pentru a crea o resursă pentru exploatarea terapeutică a „genomului care poate fi utilizat ca medicament”, am analizat ortologii macacilor pentru domeniile de medicamente cunoscute în prezent. Aproape toți ortologii care pot fi utilizați ca medicamente pot fi detectați în cele trei specii/subspecii de macaci, ceea ce indică faptul că este probabil ca aceste modele animale să fie echivalente din punct de vedere funcțional. Cu toate acestea, în foarte puține cazuri, ortologul găsit la macac este diferit de omologul său uman. De exemplu, o aciltransferază mitocondrială (GLYATL2), care transferă o grupare acil la glicină, a fost complet pierdută în toate cele trei macacii. În plus, am identificat 19 gene umane cu domenii care pot fi utilizate ca medicamente, care au devenit pseudogene la macaci (Secțiunea suplimentară 7). De exemplu, gena receptorului hormonului paratiroidian 1 (PTH1R), ținta medicamentului antiosteoporotic teriparatidă (Forteo)18,19, conține un codon de oprire prematură la macaci. Una dintre țintele factorului de creștere a keratinocitelor uman recombinant (Palifermin20), receptorul 3 al factorului de creștere a fibroblastelor, codificat de FGFR3, a fost, de asemenea, pseudogenizată la macaci din cauza prezenței unui codon de oprire prematură.

De interes biomedical suplimentar sunt deviațiile patogene compensate. Acestea reprezintă alele missense umane presupus patologice în care aminoacizii de substituție sunt identici cu reziduurile de aminoacizi de tip sălbatic în poziții ortologe în alte organisme. Am identificat 931 de deviații patogene compensate la patru specii de primate strâns înrudite (cimpanzeu și cei trei macaci), dintre care 220 variau între primatele neumane, inclusiv 65 care variau între cele trei specii de macaci (secțiunea suplimentară 8 și tabelul suplimentar 26). De exemplu, o mutație (R40→H40) în gena ornitin transcarbamilazei (OTC) a fost evidentă la cele două subspecii de macaci rhesus, dar nu și la macacul CE. Pe baza exemplelor de diferențe genetice identificate prezentate mai sus, este clar că existența potențială a unor astfel de diferențe interspecii ar trebui luată în considerare atunci când se selectează macacii pentru a fi folosiți ca modele de boală.

Compararea profilurilor de expresie a genelor (Secțiunea suplimentară 9) între macacul CE și macacul IR a arătat că ortologii lor au prezentat profiluri de expresie conservate în același țesut. Cu toate acestea, am observat că testiculul a prezentat niveluri de expresie care au fost mai divergente între acei ortologi care au avut coeficienți de corelație Pearson mai mici (Secțiunea suplimentară 9). Observarea faptului că mai multe gene prezintă niveluri de expresie inconsecvente în testicule, în comparație cu celelalte țesuturi, ar putea fi legată de rata rapidă de evoluție manifestată de genele exprimate în spermă de primate21. Datele transcriptomice au servit, de asemenea, la identificarea mai multor gene noi la macacii CE în raport cu macacii rhesus.

În concluzie, secvențierea și analizele noastre ale celor două genomuri de macaci au confirmat faptul că hibridizarea introgresivă a jucat probabil un rol important în formarea genomului macacilor CE existenți de origine continentală. Astfel, macacul CE ar putea fi un model util pentru explorarea schimbului de gene între speciile de primate și a rolului consecvent al acestui proces în evoluția și speciația primatelor. Cele două noi genomuri de macac prezentate aici evidențiază, de asemenea, gradul de variație existent între aceste modele animale de primate neumane utilizate pe scară largă. Diversitatea genetică abundentă evidentă la macacii individuali din populații geografice distincte prezintă un interes direct pentru primatologie, medicina preclinică, genetica populațiilor și studiile filogeografice.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.