Stiamo sperimentando come gli algoritmi informatici stanno rivoluzionando la biologia

L'intelligenza artificiale può essere utilizzata per prevedere la struttura 3D delle proteine. Presto sarà possibile utilizzare questi algoritmi per sviluppare proteine artificiali personalizzate, scrive Beat Christen.

Beat Christen

Gli algoritmi informatici supportano la ricerca biomedica da decenni e sono diventati sempre più importanti. Tuttavia, quello che stiamo vivendo è un salto quantico che eclissa tutto ciò che è stato fatto in precedenza e che avrà conseguenze impreviste: Gli algoritmi di intelligenza artificiale (AI) hanno permesso di prevedere, basandosi unicamente sulla sequenza lineare degli elementi costitutivi delle proteine - gli aminoacidi - in quale struttura tridimensionale si assemblerà questa catena di elementi costitutivi, e di farlo con estrema precisione.

Per capire il significato di tutto ciò, è necessario sapere che la biologia a livello cellulare riguarda sempre l'interazione spaziale delle molecole, determinata dalla loro struttura tridimensionale. Solo quando conosciamo le strutture e le interazioni possiamo capire la biologia. E solo quando conosciamo la struttura delle molecole possiamo sviluppare farmaci mirati che influenzino la funzione di queste molecole.

Molecole proteiche grafiche
Le proteine sono molecole filiformi che si assemblano in una specifica forma tridimensionale. (Grafico: Shutterstock)

Finora la struttura tridimensionale delle proteine poteva essere determinata con tre metodi sperimentali: L'analisi della struttura a raggi X, la risonanza magnetica nucleare e, da qualche anno, la crio-microscopia elettronica. Il fatto che ora si sia aggiunto un quarto metodo preciso con l'IA non è dovuto solo al miglioramento degli algoritmi di IA e all'elevata potenza di calcolo oggi decisa. Per poter fare previsioni precise, l'IA ha bisogno anche di una grande quantità di dati di qualità eccezionale con cui essere addestrata. Il salto di qualità è stato quindi possibile grazie agli immensi progressi e agli sforzi compiuti in entrambi i settori: scienza dei dati e ricerca sperimentale sulle proteine.

Concorrenza tra ricerca pubblica e privata

Attualmente i riflettori sono puntati sul programma di intelligenza artificiale Alphafold di Deepmind, una società del gruppo Google. Attualmente è probabilmente l'attore più importante nella predizione delle strutture proteiche. Tuttavia, il dibattito pubblico spesso non riconosce che Deepmind non è affatto l'unico attore in questo campo e che sono in corso ricerche eccellenti, in particolare da parte di David Baker dell'Università di Washington.

? probabile che questa competizione tra ricerca pubblica e privata abbia dato impulso e impulso al settore della ricerca nel suo complesso. Naturalmente, gli attori privati tengono per sé molte delle loro scoperte per interesse commerciale. Tuttavia, una ricerca altamente competitiva ha anche portato a immensi miglioramenti negli algoritmi di IA pubblicati che l'intera comunità scientifica può ora utilizzare e sviluppare ulteriormente. Mi aspetto che la tendenza continui. Presto gli algoritmi di IA ci forniranno strutture altamente precise per tutte le proteine conosciute. Questo ci permetterà di progettare al computer farmaci più mirati.

"Il logico passo successivo sarà ora quello di utilizzare gli algoritmi di intelligenza artificiale nella direzione opposta".Beat Christen

Sulla base di una struttura molecolare tridimensionale sviluppata al computer, in futuro dovrebbe essere possibile utilizzare l'intelligenza artificiale per calcolare una sequenza di amminoacidi che si assembli esattamente alla struttura desiderata con la funzione molecolare desiderata.

Una volta determinata la sequenza di aminoacidi, entra in gioco il mio campo di ricerca. Mi occupo dello sviluppo di geni e genomi artificiali e utilizzo anche algoritmi informatici. Partendo dalle sequenze di aminoacidi, calcoliamo come queste si traducono in sequenze di elementi costitutivi dei geni, cioè in DNA. E lo facciamo in modo tale che questi geni possano essere facilmente prodotti artificialmente nella pratica.

Flusso inverso di informazioni

Presto dovrebbe essere possibile calcolare e sintetizzare un gene artificiale basato su qualsiasi struttura proteica tridimensionale sviluppata al computer. Dal punto di vista biotecnologico, ciò consentirà di produrre proteine artificiali nei microrganismi, ad esempio nuovi principi attivi farmaceutici, vaccini o enzimi di interesse per l'industria.

Dai primi esseri viventi, diversi miliardi di anni fa, fino a oggi, le informazioni biologiche sono sempre state immagazzinate sotto forma di DNA. Nelle cellule biologiche, queste informazioni vengono tradotte prima in molecole di RNA e poi in proteine. Finora non esisteva un processo che invertisse questo flusso di informazioni e traducesse le informazioni proteiche in informazioni sul DNA. Questo cambierà presto con l'intelligenza artificiale. Per i biologi come me, si tratta di uno sviluppo incredibilmente spettacolare. Avrà un impatto enorme sulla biotecnologia e sulla medicina.

JavaScript è stato disabilitato nel tuo browser