Il completamento di un genoma di riferimento umano da telomero a telomero, T2T-CHM13, ha risolto regioni complesse del genoma, comprese regioni ripetitive e omologhe.
Sulla rivista Science i ricercatori di vari centri di genetica, genomica e bioingegneria negli USA presentano uno studio epigenetico ad alta risoluzione di sequenze precedentemente irrisolte, che rappresentano intere braccia corte del cromosoma acrocentrico, espansioni della famiglia genica e una raccolta diversificata di classi ripetute.
Questa risorsa mappa con precisione la metilazione CpG (32,28 milioni di CpG), l’accessibilità del DNA e i set di dati a lettura breve (166.058 picchi di sequenziamento dell’immunoprecipitazione della cromatina precedentemente irrisolti) per fornire prove dell’attività su geni precedentemente non identificati o corretti e rivela una regolazione specifica del paralogo clinicamente rilevante. L’analisi della metilazione del CpG attraverso i centromeri umani da sei diversi individui ha generato una stima della variabilità nella localizzazione del cinetocore.
Questo lavoro fornisce una visione completa dell’organizzazione epigenetica di un genoma umano completo, scoprendo modelli epigenetici complessi nell’8% del genoma umano precedentemente irrisolto. L’annotazione funzionale di queste regioni intrattabili non è stata trascurata a causa della loro mancanza di importanza, ma piuttosto a causa dei limiti tecnologici. “Il nostro studio apre queste regioni per esplorare il loro epigenoma, senza lasciare nessuna regione del genoma irraggiungibile -scrivono i ricercatori- Qui, con la combinazione di un completo assemblaggio del genoma e progressi tecnologici nella profilazione epigenetica, facciamo progressi sostanziali nella valutazione funzionale del genoma, espandendo ENCODE ( 1) per includere dal 3 al 19% in più di chiamate di picco e aumentare del 10% il numero di chiamate di metilazione CpG. I metodi epigenetici di lunga lettura, qui incentrati sulla metilazione dei nanopori e sull’accessibilità della cromatina, possono risolvere i modelli epigenetici a singola molecola all’interno di queste regioni, fornendo una valutazione fondamentale di queste aree. I metilomi a lunga lettura di punti temporali di sviluppo distintivi hanno intervistato più del 99% dei CpG, stabilendo i metilomi CHM13 e HG002 come i metilomi umani più completi fino ad oggi. Con questi set di dati, abbiamo profilato i 225 Mbp aggiuntivi di sequenza e 2680 annotazioni geniche”.
Dei geni precedentemente irrisolti, ne sono stati trovati 57 con evidenza di promotori attivi, inclusi i segni H3K4me3 o H3K27ac, in più di un tipo di cellula. Poi sono stati trovati 82 geni con un singolo tipo di cellula che supporta promotori attivi, fornendo la prova che queste annotazioni geniche precedentemente irrisolte sono funzionalmente attive attraverso i tessuti. Con più dati da diversi tipi di tessuto, si possono identificare geni ancora più funzionali. “Più in generale -proseguono- abbiamo scoperto che i paralog genici evolutivamente più antichi erano repressi epigeneticamente (simile al silenziamento epigenetico dei trasposoni), conferendo stabilità al genoma e influenzando così l’evoluzione del genoma. Esaminando il DNA del satellite, abbiamo integrato set di dati a lettura breve e lunga per studiare gli array satellitari completi, rivelando che queste regioni variano nell’attività epigenetica e trascrizionale nonostante l’identità di sequenza elevata ed evidenziando l’importanza dell’ambiente cromosomico locale come modulatore dell’epigenetica. È noto che il DNA ripetitivo sulle braccia corte acrocentriche gioca un ruolo nella formazione nucleolare; tuttavia, la precedente assenza di queste regioni dal riferimento umano ha ostacolato la ricerca. I nostri risultati suggeriscono che, piuttosto che agire all’unisono, le famiglie ripetute su questi singoli cromosomi acrocentrici hanno tutte la propria identità epigenetica, probabilmente contribuendo ai loro ruoli funzionali unici nell’integrità e nell’organizzazione del genoma”.
Una delle caratteristiche di questi dati epigenetici a singola molecola è la capacità di studiare i modelli di epigenetica a singola molecola: “Abbiamo usato la metilazione da sola per raggruppare le letture in aree ripetitive prive di polimorfismi eterozigoti -specificano nello studio- Ciò include l’array DXZ4, in cui la firma di metilazione è fondamentale per l’inattivazione del cromosoma X. Con l’aumento della risoluzione, i nostri risultati mostrano la variabilità della metilazione tra le popolazioni raggruppate e la variazione epigenetica intra-array all’interno dei monomeri adiacenti nella stessa matrice. Poiché è noto che gli array di satelliti sono ipervariabili nella popolazione umana e collegati a diverse malattie umane, questi risultati evidenziano l’importanza di studi epigenetici a singola molecola a lettura lunga per comprendere la patologia della malattia”. Infine, l’assemblaggio del genoma T2T-CHM13 ha aperto l’esplorazione del centromero umano, consentendo di sondare gli elementi epigenetici, che definiscono la cromatina centromerica.
“Abbiamo esteso la nostra scoperta originale del CDR nel cromosoma 8 e nel cromosoma X a tutti i cromosomi e abbiamo scoperto che i CDR denotano la posizione delle proteine ​​​​associate al centromero (CENP-A e CENP-B nel genoma HG002) in cellule differenziate (HG002, un linfoblasto) -scrivono gli autori- Ciò fornisce prove di CDR al di fuori dei primi CHM dello sviluppo e sottolinea la loro importanza nel posizionamento del cinetocore e nella regolazione epigenetica della segregazione cromosomica. Espandendo la nostra analisi CDR ai cromosomi X maschili che rappresentano diversi aplotipi, abbiamo scoperto la variabilità nella localizzazione del CDR all’interno dell’array X HOR; tuttavia, siamo stati in grado di dimostrare l’uso dei CDR per prevedere con precisione la localizzazione del sito del cinetocore all’interno di un array attivo e riportare tra individui che rappresentano diversi antenati. Se combinato con reperti in altri organismi, ad es. mais e medaka, ciò suggerisce che il CDR è una caratteristica conservata e funzionalmente importante di centromeri complessi tra vertebrati e lignaggi vegetali. La corretta formazione del cinetocore è un processo essenziale per la divisione cellulare eucariotica, un processo che si verifica negli esseri umani 330 miliardi di volte al giorno per sostenere la vita.
I nostri risultati portano a due conclusioni principali sul CDR: (i) la posizione del CDR su un determinato array è fissata all’inizio dello sviluppo e mantenuta al momento della differenziazione e (ii) esiste un singolo CDR stabile in ciascun centromero. Il nostro profilo iniziale fornisce una moltitudine di strade per la ricerca futura, compreso il modo in cui la posizione del CDR influenza la stabilità , la malattia e l’aneuploidia meiotica e mitotica”.
“I nostri risultati fungono da studio fondamentale, ampliando gli studi sul genoma umano attraverso l’uso del riferimento completo – concludono- Rimangono sfide significative per esplorare ulteriormente l’epigenoma in un set di campioni più ampio e diversificato per ottenere un allineamento ottimale della sequenza, specialmente tra regioni ripetitive strutturalmente variabili, ad esempio HOR. Gli sforzi dell’HPRC per generare gruppi di genomi diploidi completamente in fase consentiranno l’esplorazione su scala demografica di queste aree. Le limitazioni del sequenziamento a lettura breve in regioni uniche possono essere integrate da metodi epigenetici a lettura lunga attualmente in rapido sviluppo. Siamo sull’orlo dell’esplorazione di porzioni duplicate e ripetitive del genoma. L’ulteriore sviluppo della profilazione epigenetica di lunga lettura attraverso diverse popolazioni e stati patologici rivelerà di più sulla regolazione all’interno delle regioni più sfuggenti del genoma”.
