Questo sito web utilizza cookie tecnici e, previo Suo consenso, cookie di profilazione, nostri e di terze parti. Chiudendo questo banner, scorrendo questa pagina o cliccando qualunque suo elemento acconsente all'uso dei cookie. Leggi la nostra Cookie Policy per esteso.OK

e-health

IEO, il software mette al sicuro i Big Data di genomica

Grazie a una soluzione storage l’enorme mole di dati generati dalla ricerca dell’Istituto Europeo di Oncologia sul sequenziamento del DNA ora è conservata in modo affidabile, a un costo contenuto e sostenibile nell’arco di 3-5 anni, con la garanzia anche del supporto e della manutenzione dei sistemi

19 Nov 2014

Redazione

L’Istituto Europeo di Oncologia (IEO) – il centro nato nel 1994 da un’idea del Prof. Umberto Veronesi – ha adottato una soluzione software storage per conservare dati generati dal sequenziamento del genoma.

L’Istituto oggi è un centro all’avanguardia nella ricerca clinico scientifica e la cura dei tumori, nonché un riferimento per la formazione in oncologia, e impiega oltre 1.500 persone in un contesto di costante attenzione alle esigenze del paziente. Un’area di ricerca prioritaria è la genomica, che si occupa dell’applicazione delle conoscenze sul DNA: circa dieci gruppi di ricerca di IEO stanno attivamente utilizzando con successo le tecnologie di sequenziamento del genoma per i numerosi studi in corso sulla biologia dei tumori. E in quest’ambito le tecnologie informatiche e bioinformatiche hanno contribuito a livello mondiale sia a velocizzare il sequenziamento sia a diminuirne i costi. Nel 2004 era possibile completare solo 30 sequenze in un anno a costi esorbitanti: 30 milioni di dollari. Negli anni il costo si è abbassato notevolmente arrivando nel 2013 a soli 100 dollari per sequenza.

Il genoma: un “Big Data” da conservare al sicuro

Le molecole del DNA possono essere rappresentate come sequenze di caratteri dell’alfabeto (a, t, c, g) che sono anche le 4 basi, da un punto di vista informatico, per memorizzare un carattere (ossia una base), quindi è necessario un byte. Approssimativamente il genoma umano è lungo 3,2 miliardi di caratteri (basi). Si tratta quindi di una mole di dati in crescita esponenziale da conservare nei sistemi di IEO che negli ultimi quattro anni è aumentata di oltre cinque volte, arrivando quest’anno a più di 160 TB di dati, a cui vanno aggiunti anche più di 200 TB provenienti dalle unità di Imaging.

Da qui è nata la necessità di trovare una soluzione di software storage affidabile e sicura per conservare i big data generati a un costo contenuto e sostenibile nell’arco di 3-5 anni, garantendo anche il supporto e la manutenzione dei sistemi, senza però doversi legare a un unico hardware vendor. La scelta è ricaduta su NexentaStor che fornisce servizi di file e di storage a blocchi unificati e opera sui sistemi hardware standard con configurazioni scalabili che vanno da poche decine di terabyte a petabyte. La soluzione scelta inoltre utilizza file system a 128 bit ZFS in grado di fornire uno spazio di 16 miliardi di miliardi di volte la capacità dei file system a 64 bit. In questo modo la continuità operativa e il disaster recovery sono gestiti grazie all’elevata disponibilità e la compressione abilitata su tutti i file system ZFS, con un rapporto di compressione fino a 1.6x, ha efficacemente permesso di risparmiare spazio, senza compromettere le prestazioni.

IEO, il software mette al sicuro i Big Data di genomica

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

    LinkedIn

    Twitter

    Whatsapp

    Facebook

    Google+

    Link

    Articolo 1 di 5