Il più grande modello di IA per la biologia

  • Postato il 23 febbraio 2025
  • Di Focus.it
  • 1 Visualizzazioni
Il 19 febbraio è stato rilasciato il più grande (per potenza di calcolo necessaria a digerire i dati su cui si è allenato) modello di IA per la biologia. Addestrato su 128.000 genomi tratti da ogni ramo dell'albero della vita - dagli archea ai batteri, dalle piante agli umani e ad altri animali, per un totale di 9,3 trilioni di lettere di DNA - è capace di scrivere su richiesta la sequenza genetica di un cromosoma o di dare un senso a un frammento di DNA esistente, come quello di antichi animali estinti; e potrebbe aiutare a capire meglio la genesi di alcune ancora misteriose malattie ereditarie.. Una base da personalizzare. Evo-2, questo il nome dell'IA è stata sviluppata da due gruppi di scienziati dell'Arc Institute e della Stanford University di Palo Alto, in California, insieme all'azienda tecnologica statunitense NVIDIA. I suoi creatori, che hanno descritto gli sforzi per realizzarlo in un articolo in pre-pubblicazione e che hanno condiviso il codice e altri parametri utili a replicarlo, lo considerano come una piattaforma libera che i ricercatori di tutto il mondo possono adattare alle loro esigenze. . Specializzato in Junk dna. A differenza di altri modelli di IA specializzati nella predizione della struttura e del ripiegamento delle proteine (l'ambito di ricerca premiato con il Nobel per la Chimica 2024), Evo-2 è stato formato su genomi che contengono sia le sequenze codificanti, ossia che forniscono le istruzioni per sintetizzare proteine, sia quelle non codificanti, pezzetti di DNA che non danno informazioni su come produrre proteine ma che possono controllare quando, dove e come i geni sono attivi.. Solo il 2% del nostro materiale genetico codifica per delle proteine. Il rimanente è, appunto, DNA non codificante, in passato anche chiamato junk DNA, DNA spazzatura, la cui importanza, in particolare nella regolazione dell'espressione dei geni, è finita sotto i riflettori soltanto negli ultimi anni. . Il gioco si fa duro. Rispetto alla prima versione del modello di IA, Evo, addestrato su 80.000 genomi di organismi semplici o procarioti, Evo-2 è stato inizialmente allenato su un database che comprende il DNA di organismi eucarioti, il dominio più complesso. Sono gli organismi costituiti da una o più cellule che abbiano un nucleo ben differenziato contenente la maggior parte del DNA cellulare, nei quali le sequenze di DNA non codificante possono trovarsi anche molto distanti dai geni di cui regolano l'attività.. Messo alla prova. Per dimostrare le sue abilità nell'apprendere "le regole della grammatica regolatoria del DNA", Evo-2 è stato sfidato a prevedere gli effetti (già noti e studiati) delle mutazioni nel gene BRCA1 implicate nella genesi di tumori al seno o a decifrare il complesso genoma di un mammut lanoso estinto, ottenendo ottimi risultati. In futuro potrebbe aiutarci a comprendere le conseguenze di alcune mutazioni genetiche ancora poco studiate sulla salute dei pazienti.. Creazione ex novo. Uno degli aspetti più interessanti dell'IA Evo-2 è la capacità di scrivere "da zero" sequenze genetiche non solo corrispondenti a proteine, ma anche a pezzetti di DNA non codificanti che cooperano con esse. A livello pratico ciò equivale alla possibilità di progettare genomi per ottenere strumenti di editing genetico più precisi e batteri, virus, proteine, mitocondri, cromosomi ingegnerizzati più precisi e più vicini agli originali. L'obiettivo a tendere è di contribuire a una nuova rivoluzione nel campo della biologia, che si spinga oltre a quella che ha già ridisegnato la comprensione e la progettazione delle proteine..
Autore
Focus.it

Potrebbero anche piacerti