Ricercatori del Regno Unito sperano che un nuovo database pubblicamente disponibile che hanno creato si riduca, anziché aumentare, nel tempo. Questo perché è un compendio delle migliaia di proteine poco studiate codificate dai geni nel genoma umano, le cui esistenze sono note ma le cui funzioni sono in gran parte sconosciute.
Il database, chiamato “unknome”, è il lavoro di Matthew Freeman della Dunn School of Pathology dell’Università di Oxford, Inghilterra, e Sean Munro del MRC Laboratory of Molecular Biology di Cambridge, Inghilterra, e dei loro colleghi, ed è descritto nell’articolo scientifico accessibile liberamente su PLOS Biology. Le loro stesse indagini su un sottoinsieme di proteine nel database rivelano che la maggior parte contribuisce a importanti funzioni cellulari, tra cui lo sviluppo e la resilienza allo stress.
La sequenza del genoma umano ha reso chiaro che codifica migliaia di probabili sequenze proteiche le cui identità e funzioni sono ancora sconosciute. Ci sono molteplici ragioni per questo, tra cui la tendenza a concentrare i limitati finanziamenti per la ricerca su bersagli già noti e la mancanza di strumenti, tra cui gli anticorpi, per interrogare le cellule sulla funzione di queste proteine. Ma i rischi di ignorare queste proteine sono significativi, argomentano gli autori, poiché è probabile che alcune, forse molte, svolgano ruoli importanti nei processi cellulari critici e possano fornire spunti e bersagli per interventi terapeutici.
Per promuovere una più rapida esplorazione di tali proteine, gli autori hanno creato il database unknome (www.unknome.org), che assegna a ogni proteina un punteggio di “conoscenza”, riflettendo le informazioni presenti nella letteratura scientifica riguardo alla funzione, alla conservazione tra le specie, alla compartimentalizzazione subcellulare e ad altri elementi.
Basandosi su questo sistema, ci sono molte migliaia di proteine la cui conoscenza è vicina allo zero. Sono incluse proteine da organismi modello, insieme a quelle dal genoma umano. Il database è aperto a tutti ed è personalizzabile, consentendo all’utente di fornire i propri pesi a diversi elementi, generando così il proprio insieme di punteggi di conoscenza per prioritizzare la propria ricerca.
Per testare l’utilità del database, gli autori hanno scelto 260 geni negli esseri umani per i quali c’erano geni comparabili nelle mosche, e che avevano punteggi di conoscenza di 1 o meno in entrambe le specie, indicando che non si sapeva quasi nulla su di essi. Per molti di essi, una completa soppressione del gene era incompatibile con la vita nelle mosche; le soppressioni parziali o specifiche per tessuto hanno portato alla scoperta che una grande frazione contribuiva a funzioni essenziali che influenzavano la fertilità, lo sviluppo, la crescita dei tessuti, il controllo della qualità delle proteine o la resistenza allo stress.
I risultati suggeriscono che, nonostante decenni di studio dettagliato, ci sono migliaia di geni delle mosche che rimangono da capire anche a livello molto basilare, e lo stesso è chiaramente vero per il genoma umano. “Questi geni non caratterizzati non hanno meritato la loro trascuratezza”, ha detto Munro. “Il nostro database fornisce una piattaforma potente, versatile ed efficiente per identificare e selezionare geni importanti di funzione sconosciuta per l’analisi, accelerando così la chiusura del divario nella conoscenza biologica che l’unknome rappresenta.”
Munro aggiunge: “Il ruolo di migliaia di proteine umane rimane poco chiaro eppure la ricerca tende a concentrarsi su quelle che sono già ben comprese. Per contribuire ad affrontare questo problema, abbiamo creato un database Unknome che classifica le proteine in base a quanto poco si sa su di esse, e poi abbiamo condotto screening funzionali su una selezione di queste proteine misteriose per dimostrare come l’ignoranza possa guidare la scoperta biologica.“