Dove attraccano i macchinari per la sintesi proteica

Per molti miliardi di sequenze diverse di blocchi di RNA, i ricercatori dell'ETH sono in grado di prevedere la capacità di aggancio del macchinario di sintesi proteica cellulare. Questo aggancio ha un'influenza significativa sulla quantità di proteine prodotte. Per sviluppare il modello di previsione, gli scienziati utilizzano una combinazione di esperimenti di biologia sintetica e algoritmi di apprendimento automatico.

Ribosoma
I ribosomi sono le macchine per la sintesi proteica delle cellule. Leggono le informazioni genetiche dall'RNA messaggero (viola) e producono proteine (gialle) sulla base di esse. (Grafico: Fototeca scientifica)

Il materiale genetico dei batteri, delle piante e persino degli esseri umani è oggi molto facile da decifrare, eppure nasconde molte domande in apertura. Per esempio, ci sono i trascritti di RNA dei geni e i siti su di essi a cui si aggancia il macchinario di sintesi proteica cellulare (i ribosomi) per leggere le informazioni genetiche. In passato mancava una comprensione completa di questi siti di aggancio.

Un team interdisciplinare di ricercatori del Dipartimento biosistemi e ingegneria (D-BSSE) dell'ETH di Zurigo a Basilea ha ora sviluppato un approccio che consente per la prima volta di ottenere informazioni dettagliate su un numero incredibilmente elevato di siti di aggancio nei batteri. L'approccio combina metodi sperimentali di biologia sintetica e apprendimento automatico.

Controllo fine della produzione di proteine

I siti di aggancio sono brevi sequenze di blocchi di RNA a monte di ciascun gene. In passato, i biotecnologi hanno anche sviluppato siti di aggancio artificiali. I ribosomi si agganciano molto bene ad alcuni di essi, ma meno bene ad altri. Più i ribosomi riescono ad agganciarsi a una particolare variante, più è probabile che leggano le informazioni del gene e che producano una quantità maggiore della proteina corrispondente.

Quando i biotecnologi utilizzano i batteri per produrre farmaci, ad esempio, possono influenzare la quantità prodotta selezionando i siti di aggancio dei ribosomi. "Questo controllo è particolarmente interessante e importante quando si introducono nelle cellule reti geniche complesse per produrre più proteine contemporaneamente. ? quindi importante ottimizzare la loro quantità", spiega Markus Jeschek. ? uno scienziato senior e capogruppo del D-BSSE.

Un esperimento con 300.000 sequenze

Insieme ai professori dell'ETH Yaakov Benenson e Karsten Borgwardt e ai membri dei rispettivi gruppi, ha ora sviluppato un metodo per determinare la capacità dei ribosomi di agganciarsi a oltre 300.000 sequenze di RNA generate sinteticamente. In precedenza, ciò era possibile solo per poche centinaia di sequenze per esperimento.

L'approccio dei ricercatori dell'ETH utilizza il "deep sequencing", la tecnica più moderna per determinare le sequenze di DNA e RNA. In laboratorio, gli scienziati hanno prodotto più di 300.000 diversi siti di aggancio dei ribosomi in un unico passaggio e hanno fuso ciascuno di questi con un gene per un enzima che modifica un pezzo di DNA. Hanno introdotto i corrispondenti costrutti genici nei batteri per vedere nell'esperimento quanto fortemente i ribosomi si attaccano all'RNA nei singoli casi. Quanto meglio funziona il rispettivo sito di aggancio, tanto più enzima viene prodotto nella cellula e tanto più è probabile che il pezzo di DNA venga modificato. Dopo l'esperimento, i ricercatori possono leggere questo cambiamento attraverso il sequenziamento insieme alla sequenza dell'RNA del sito di aggancio.

Approccio universale

Poiché 300.000 sono solo una piccola parte dei molti miliardi di siti di legame dei ribosomi teoricamente concepibili, gli scienziati hanno analizzato i loro dati utilizzando algoritmi di apprendimento automatico. "Questi algoritmi riconoscono correlazioni statistiche complesse in grandi insiemi di dati. Con il loro aiuto, possiamo prevedere la capacità dei ribosomi di legare una determinata sequenza di RNA", spiega Karsten Borgwardt, professore di Data Mining. I ricercatori dell'ETH hanno deciso di rendere questi modelli di previsione liberamente disponibili come software, in modo che anche altri scienziati possano utilizzarli. Presto pubblicheranno anche un servizio online di facile utilizzo.

L'approccio scelto dagli scienziati è universale, come sottolineano Benenson e Jeschek. I ricercatori intendono quindi utilizzarlo in altri organismi, comprese le cellule umane. "L'influenza delle informazioni genetiche sulla quantità di proteine prodotte in una cellula è interessante anche per gli esseri umani", afferma Benenson. "Soprattutto in relazione alle malattie genetiche".

Letteratura di riferimento

H?llerer S, Papaxanthos L, Gumpinger AC, Fischer K, Beisel C, Borgwardt K, Benenson Y, Jeschek M: La registrazione fenotipica su larga scala basata sul DNA e il deep learning consentono una mappatura sequenza-funzione altamente accurata. Nature Communications 2020, doi: pagina esterna10.1038/s41467-020-17222-4

JavaScript è stato disabilitato nel tuo browser