Algoritmo che predice le strutture biologiche


Algoritmo che predice le strutture biologiche

Sviluppati metodi di machine learning che prevedono accuratamente le forme 3D di bersagli farmacologici e altre importanti molecole biologiche, anche quando sono disponibili solo dati limitati.

Determinare le forme 3D di molecole biologiche è uno dei problemi più difficili della moderna biologia e della scoperta medica. Le aziende e gli istituti di ricerca spesso spendono milioni di dollari per determinare una struttura molecolare - e anche questi massicci sforzi spesso non vanno a buon fine.

Usando nuove tecniche di machine learning, gli studenti Stephan Eismann e Raphael Townshend, diretti dal dottor Ron Dror, (1) professore associato di informatica, hanno sviluppato un approccio che supera questo problema predicendo computazioni accurate.

In particolare, il loro approccio riesce anche quando si impara da poche strutture conosciute, rendendolo applicabile ai tipi di molecole le cui strutture sono più difficili da determinare sperimentalmente.

Il loro lavoro, pubblicato su Science (2) e su Proteins (3) sono descritte le teorie delle applicazioni per molecole di RNA e complessi multi-proteici. Il documento della scienza è una collaborazione con il laboratorio di Stanford di Rhiju Das, professore associato della biochimica.

«Biologia strutturale, che è lo studio delle forme delle molecole, ha questo mantra che la struttura determina la funzione», ha affermato Raphael Townshend, che è l'autore di entrambi i documenti.

L'algoritmo progettato dai ricercatori prevede strutture molecolari accurate e, in tal modo, può consentire agli scienziati di spiegare come funzionano diverse molecole, con applicazioni che vanno dalla ricerca biologica fondamentale alle pratiche di progettazione di farmaci informati.

«Le proteine sono macchine molecolari che eseguono tutti i tipi di funzioni. Per compiere le loro funzioni, le proteine vengono spesso legate ad altre proteine», ha detto Eismann, un autore che lavora su entrambi i documenti. «Se sai che un paio di proteine è implicato in una malattia e sai come interagiscono in 3D, puoi provare a indirizzare questa interazione molto specificamente con un farmaco».

Eismann e Townshend sono autori principali della carta scientifica con il dottor Andrew Watkins del laboratorio DAS, e anche con l'autrice della ricerca sulle proteine Nathaniel Thomas.

Progettare l'algoritmo

Invece di specificare ciò che rende una previsione strutturale più o meno accurata, i ricercatori hanno individuato nell'algoritmo stesso queste caratteristiche molecolari. Lo hanno fatto perché hanno scoperto che la tecnica convenzionale di fornire tali conoscenze può oscillare un algoritmo a favore di determinate caratteristiche, impedendo così di trovare altre caratteristiche informative.

«Il problema con queste caratteristiche in un algoritmo è che l'algoritmo stesso diventa parte di ciò che la persona che prende queste caratteristiche pensa sia importante, e potresti perdere alcune informazioni che avresti bisogno di fare meglio», ha detto Eismann.

«La rete ha imparato a trovare concetti fondamentali che sono peculiari per la formazione della struttura molecolare, ma senza essere esplicitamente raccontati», ha affermato la townshend. «L'aspetto interessante è che l'algoritmo ha chiaramente recuperato le cose che sapevamo erano importanti, ma ha anche recuperato le caratteristiche che non sapevamo prima».

Dopo aver mostrato il successo con le proteine, i ricercatori hanno applicato il loro algoritmo a un'altra classe di importanti molecole biologiche, RNA. Hanno testato il loro algoritmo in una serie di “puzzle di RNA” da una competizione di lunga data nel loro campo, e in ogni caso, lo strumento ha sovraperformato tutti gli altri partecipanti al puzzle e lo ha fatto senza essere progettato specificamente per le strutture RNA.

Riferimenti:

(1) Ron Dror

(2) Geometric deep learning of RNA structure

(3) Hierarchical, rotation-equivariant neural networks to select structural models of protein complexes

Descrizione foto: Un nuovo algoritmo di intelligenza artificiale può scegliere la forma 3D della molecola dell'RNA da forme errate. Pronostico computazionale delle strutture in cui la piega RNAS è particolarmente importante - e particolarmente difficile - perché così poche strutture sono note. - Credit: Camille L.l. Townshend.

Autore traduzione riassuntiva e adattamento linguistico: Edoardo Capuano / Articolo originale: Stanford machine learning algorithm predicts biological structures more accurately than ever before