Lo sviluppo della società dei dati porta grandi vantaggi ma accentua anche noti problemi. I Big Data chiedono anche grandi Data Center, e i costi di sviluppo e di esercizio di queste infrastrutture tendono a esplodere.
Il corrente investimento nella costruzione di nuovi Data Center ammonta a 50 milioni di dollari l’anno per la costruzione dei nuovi edifici, a cui vanno aggiunti i costi di infrastruttura tecnologica e arredamento. Inoltre si stima che il silicio, elemento base per la fabbricazione delle memorie utilizzate nei data center, potrebbe terminare verso l’anno 2040.
Per questo motivo la ricerca verso altre forme di immagazzinamento dell’informazione è oggi molto attiva. L’Università di Washington, insieme ai laboratori di Microsoft Research, ha già realizzato un sistema di memoria prototipale basato sull’uso del DNA.
La catena del DNA è formata da una sequenza di nucleotidi di base, chiamati A, T, C, G. Per immagazzinare dei dati binari in una catena di DNA si può codificare una coppia di bit in ogni nucleotida: per esempio 00 può significare A, 01 significare G, 10 significare C, 11 significare T. Una catena DNA diventa così l’equivalente di una stringa di bit, e può essere riletta utilizzando una normale tecnica di sequenziamento.
Quali sono i vantaggi? La durata della memoria si misura in migliaia di anni, se il materiale è conservato in ambiente adeguato: buio, fresco e senza umidità. La densità straordinaria: un exabyte di dati (ovvero un milardo di GigaBytes) trova posto in soli 5 cm cubici di materiale organico. E c’è anche chi, come il professore George Church dell’Università di Harvard, sta pensando di evitare il passaggio in elettronico per alcuni tipi di dato, e sta quindi lavorando al progetto di una videocamera biologica in grado di memorizzare direttamente la ripresa video in una memoria a DNA, che viene poi riletta da opportuni batteri.
https://www.nature.com/news/lights-camera-crispr-biologists-use-gene-editing-to-store-movies-in-dna-1.22288
Naturalmente la nuova tecnologia ha ancora alcuni aspetti da mettere a punto. L’accesso casuale ad un singolo dato memorizzato dentro una sequenza di DNA è ancora un processo lento, perché come nei vecchi nastri magnetici, il processo di lettura della sequenza è seriale.
L’Università di Washington è riuscita a dimostrare la fattibilità di un accesso casuale in una struttura dati di 400 MBytes immagazzinata nel DNA, ma dimensioni più grandi ancora sono problematiche.
Nonostante questa limitazione, molte applicazioni industriali possono essere già immaginate, focalizzandosi sul tema dei backup dei dati storici. Secondo uno studio di IDC (vedi figura) circa la metà dei dati prodotti da tutto il sistema industriale non sono così critici da dover essere conservati in linea, e quindi sono eccellenti candidati per un sistema di immagazzinamento che sia molto efficiente dal punto di vista energetico, anche se assai più lento nel processo di recupero e lettura del singolo dato.