Il Disaster Recovery è l’insieme delle azioni volte a ripristinare le normali funzionalità dell’infrastruttura IT (ma non solo) dopo un evento critico, come può essere un guasto hardware, un problema software o altre problematiche che possono interrompere la normale attività di un’azienda. Definire efficacemente un piano di Disaster Recovery è essenziale per garantire continuità all’attività di un’azienda. Purtroppo spesso questo piano viene definito in maniera lacunosa o non viene definito per nulla a causa di difficoltà operative e/o dei costi elevati di implementazione .
Come vedremo in questo articolo, la diffusione delle tecnologie di virtualizzazione dell’hardware viene incontro alle problematiche di Disaster Recovery sia in termini di semplificazione delle procedure sia in termini di risparmio economico.
Business Continuity e Disaster Recovery
La Business Continuity ed il Disaster Recovery vengono spesso confusi e considerati come sinonimi. In realtà la Business Continuity rappresenta l’insieme delle azioni che garantiscono continuità del business di un’azienda in senso generale. Essa coinvolge tutte le attività aziendali e comprende anche, ad esempio, l’adeguata organizzazione del personale, il corretto approvvigionamento delle materie prime, ecc.
Il Disaster Recovery è solo una parte delle attività pianificate per fronteggiare eventi critici, eventi classificati come "disastri". Anche se spesso si parla di Disaster Recovery nell’ambito dell’infrastruttura IT, va sottolineato che in generale questa attività non è necessariamente specifica dell’IT ma può coinvolgere settori diversi dell’azienda. Tuttavia in questo articolo ci concentreremo sul Disaster Recovery in ambito IT.
Esempi di eventi disastrosi in ambito IT possono essere la rottura di un disco o di un’altra componente hardware essenziale, l’inutilizzabilità di un server a causa di un virus, il danneggiamento di file di sistema, ecc. Ma rientrano tra gli eventi da prendere in considerazione in un piano di Disaster Recovery anche l’interruzione di energia elettrica, la caduta di connettività ad Internet e situazioni analoghe. Naturalmente la rilevanza di un evento disastroso va valutata in base al tipo di attività dell’azienda: ad esempio, un’azienda che lavora pochissimo con Internet potrebbe considerare non critica l’eventuale perdita di connettività. Al contrario, per un’azienda che fornisce servizi di hosting la caduta di connettività è un evento altamente critico.
In ogni caso, è opportuno che un piano di ripristino venga organizzato accuratamente per consentire la Business Continuity dell’azienda secondo parametri considerati accettabili dall’attività dell’azienda stessa.
Approcci tradizionali
L’approccio tradizionale al Disaster Recovery è basato sul principio di ridondanza e prevede la duplicazione dell’hardware e del software coinvolti, eventualmente situati fisicamente in località distanti. Oltre alla ridondanza del sito da proteggere deve essere previsto un meccanismo di replica dei dati e delle configurazioni che può essere sincrono, cioè in tempo reale, o asincrono in base a parametri dipendenti dal business aziendale.
Questo approccio nella gestione del Disaster Recovery ha almeno un paio di aspetti che spesso ne limitano l’adozione piena:
- Costi elevati. La duplicazione dell’hardware e del software costringe a tenere macchine non produttive pronte per rimpiazzare eventualmente il sistema fuori uso, con conseguente raddoppio dei costi. A ciò si aggiunge il fatto che un upgrade hardware o software ad una macchina richiede l’analogo upgrade della macchina gemella
- Complessità di gestione. La gestione della replicazione dei dati e delle configurazione tra le macchine ridondate è un’operazione complessa, anche in presenza di software di replica specializzati. Complessa è anche l’attività di verifica periodica della bontà del piano di Disaster Recovery, dal momento che occorrerebbe fare dei test su un sistema in piena produzione.
È proprio il costo elevato uno dei principali motivi che spesso costringono un’azienda a non implementare affatto un piano di Disaster Recovery o ad implementarlo parzialmente.
In sistemi informativi complessi, inoltre, mantenere sincronizzato in termini di aggiornamento firmware e software il sistema di riserva con il sistema principale è un’operazione non banale. Per cui spesso il sistema di riserva non viene sincronizzato frequentemente ed in corrispondenza di un evento "disastroso" occorre reinstallare tutto o parte del software necessario, oltre naturalmente al ripristino dei dati dal backup. Questo comporta un notevole ritardo per il ripristino delle normali funzionalità.
Soluzioni basate sulla virtualizzazione
Le tecnologie di virtualizzazione vengono incontro all’organizzazione di un piano di Disaster Recovery consentendo di avere costi contenuti rispetto agli approcci tradizionali e tempi di ripristino molto veloci, in alcuni casi dell’ordine di qualche minuto.
Adottando macchine virtuali al posto di macchine fisiche nel processo di replica si hanno una serie di vantaggi nella messa a punto di un piano di Disaster Recovery derivanti direttamente dalle caratteristiche intrinseche delle macchine virtuali. In particolare:
- Indipendenza dall’hardware. Una macchina virtuale è indipendente dall’hardware fisico su cui viene eseguita; questo implica che al verificarsi di un guasto hardware è possibile eseguire la macchina virtuale su un’altra macchina fisica, anche se non ha le stesse caratteristiche tecniche della macchina originaria.
- Incapsulazione. Una macchina virtuale è un sistema di elaborazione completo che contiene in se tutto quello che serve; la sua rappresentazione in file ne semplifica il backup e la replicazione.
- Isolamento. Una macchina virtuale rappresenta un ambiente completamente isolato dalle altre macchine eseguite eventualmente sulla stessa macchina fisica; questo consente di fare i test di ripristino in modo abbastanza semplice e senza influire sulle macchine in produzione.