L’Istituto Europeo di Oncologia (IEO) – il centro nato nel 1994 da un’idea del Prof. Umberto Veronesi – ha adottato una soluzione software storage per conservare dati generati dal sequenziamento del genoma.
L’Istituto oggi è un centro all’avanguardia nella ricerca clinico scientifica e la cura dei tumori, nonché un riferimento per la formazione in oncologia, e impiega oltre 1.500 persone in un contesto di costante attenzione alle esigenze del paziente. Un’area di ricerca prioritaria è la genomica, che si occupa dell’applicazione delle conoscenze sul DNA: circa dieci gruppi di ricerca di IEO stanno attivamente utilizzando con successo le tecnologie di sequenziamento del genoma per i numerosi studi in corso sulla biologia dei tumori. E in quest’ambito le tecnologie informatiche e bioinformatiche hanno contribuito a livello mondiale sia a velocizzare il sequenziamento sia a diminuirne i costi. Nel 2004 era possibile completare solo 30 sequenze in un anno a costi esorbitanti: 30 milioni di dollari. Negli anni il costo si è abbassato notevolmente arrivando nel 2013 a soli 100 dollari per sequenza.
Il genoma: un “Big Data” da conservare al sicuro
Le molecole del DNA possono essere rappresentate come sequenze di caratteri dell’alfabeto (a, t, c, g) che sono anche le 4 basi, da un punto di vista informatico, per memorizzare un carattere (ossia una base), quindi è necessario un byte. Approssimativamente il genoma umano è lungo 3,2 miliardi di caratteri (basi). Si tratta quindi di una mole di dati in crescita esponenziale da conservare nei sistemi di IEO che negli ultimi quattro anni è aumentata di oltre cinque volte, arrivando quest’anno a più di 160 TB di dati, a cui vanno aggiunti anche più di 200 TB provenienti dalle unità di Imaging.
Da qui è nata la necessità di trovare una soluzione di software storage affidabile e sicura per conservare i big data generati a un costo contenuto e sostenibile nell’arco di 3-5 anni, garantendo anche il supporto e la manutenzione dei sistemi, senza però doversi legare a un unico hardware vendor. La scelta è ricaduta su NexentaStor che fornisce servizi di file e di storage a blocchi unificati e opera sui sistemi hardware standard con configurazioni scalabili che vanno da poche decine di terabyte a petabyte. La soluzione scelta inoltre utilizza file system a 128 bit ZFS in grado di fornire uno spazio di 16 miliardi di miliardi di volte la capacità dei file system a 64 bit. In questo modo la continuità operativa e il disaster recovery sono gestiti grazie all’elevata disponibilità e la compressione abilitata su tutti i file system ZFS, con un rapporto di compressione fino a 1.6x, ha efficacemente permesso di risparmiare spazio, senza compromettere le prestazioni.