Organizația non-profit de cercetare biomedicală Arc Institute și Universitatea Stanford, în colaborare cu gigantul Nvidia şi reunind cercetători de la Stanford, UC Berkeley şi UC San Francisco, au lansat luni cel mai mare model AI pentru biologie, numit Evo 2.
Noul AI a fost antrenat pe ADN-ul a peste 100.000 de specii din întregul arbore al vieţii. Datorită înţelegerii profunde a vieţii pe care o posedă, acesta poate identifica modele în secvenţele genetice pentru care cercetătorii ar avea nevoie de ani de zile pentru a le descoperi.
„Evo 2 reprezintă o etapă majoră pentru genomica generativă”, a declarat Patrick Hsu, cofondator și cercetător principal al Arc Institute și profesor de bioinginerie la Universitatea California, Berkeley. „Prin avansarea înțelegerii noastre a acestor componente fundamentale ale vieții putem urmări soluții în domeniul sănătății și al științei mediului care sunt inimaginabile în prezent,” a adăugat expertul, citat de Genetic Engeneering & Biotechnology News.
Performanțele modelului

- Modelul poate identifica cu precizie mutaţiile cauzatoare de boli în genele umane şi este capabil să proiecteze noi genomuri similare genomului bacteriilor simple.
- AI-ul poate, de asemenea, procesa secvenţe genetice de până la 1 milion de nucleotide simultan, permiţându-i să înţeleagă relaţiile dintre părţi îndepărtate ale aceluiaşi genom.
- Bazându-se pe predecesorul său Evo 1, care a fost antrenat în întregime pe genomuri unicelulare, Evo 2 este cel mai mare model de AI din biologie, antrenat cu peste 9,3 trilioane de nucleotide, 128.000 de genomuri întregi, precum şi date metagenomice.
- Evo 2 a fost antrenat vreme de mai multe luni pe platforma NVIDIA DGX Cloud AI prin Amazon Web Services, folosind peste 2.000 de plăci video NVIDIA H100.
Disponibil pentru oamenii de știință din toată lumea
Oamenii de știință de pretutindeni pot accesa acum Evo 2, un nou model de bază puternic care înțelege codul genetic pentru toate domeniile vieții. Prezentat ca fiind cel mai mare model AI disponibil publicului pentru date genomice, acesta a fost construit pe platforma NVIDIA DGX Cloud într-o colaborare condusă de organizația non-profit de cercetare biomedicală Arc Institute și Universitatea Stanford.
Evo 2 este disponibil pentru dezvoltatorii globali pe platforma NVIDIA BioNeMo, inclusiv ca microserviciu NVIDIA NIM pentru implementarea AI facilă și sigură.
Antrenat pe un set enorm de date de aproape 9 trilioane de nucleotide – elementele de bază ale ADN-ului și ARN-ului – Evo 2 poate fi aplicat în aplicații de cercetare biomoleculară, inclusiv predicția formei și funcției proteinelor pe baza secvenței lor genetice, identificarea de molecule noi pentru aplicații medicale și industriale și evaluarea modului în care mutațiile genelor afectează funcția lor.
Microserviciul NVIDIA NIM pentru Evo 2 permite utilizatorilor să genereze o varietate de secvențe biologice, cu setări pentru ajustarea parametrilor modelului.
Dezvoltatorii interesați de reglarea fină a Evo 2 pe seturile lor de date proprietare pot descărca modelul prin intermediul cadrului open-source NVIDIA BioNeMo, o colecție de instrumente de calcul accelerat pentru cercetarea biomoleculară.
„Proiectarea unei noi biologii a fost în mod tradițional un proces laborios, imprevizibil și artizanal”, a declarat Brian Hie, profesor asistent de inginerie chimică la Universitatea Stanford, bursier al Facultății de Știință a Datelor Stanford din cadrul Fundației Dieter Schwarz și cercetător în domeniul inovării la Institutul Arc. „Cu Evo 2, facem proiectarea biologică a sistemelor complexe mai accesibilă cercetătorilor, permițând crearea de progrese noi și benefice într-o fracțiune din timpul care ar fi fost necesar anterior.”
Facilitarea cercetării științifice complexe
Înființat în 2021 cu 650 de milioane de dolari de la donatorii săi fondatori, Institutul Arc le permite cercetătorilor să abordeze provocările științifice pe termen lung, oferind oamenilor de știință finanțare multianuală – permițându-le să se concentreze asupra cercetării inovatoare în loc să scrie granturi.
Cercetătorii săi de bază primesc spațiu de laborator de ultimă generație și finanțare pentru perioade de opt ani, reînnoibile, care pot fi deținute concomitent cu posturile la unul dintre partenerii universitari ai institutului, care includ Universitatea Stanford, Universitatea din California, Berkeley și Universitatea din California, San Francisco.
(Citește și: Cel mai mare proiect național de cercetare genomică, demarat de UMF Carol Davila: determinarea genomului de referință pentru populația României)
****