DPM 2010 - Nuove funzionalità di autohealing
Ciao a tutti ,
Oggi vi parlerò delle nuove funzionalità di autohealing (autocorrezione) presenti in DPM 2010 e di come fare un tuning mirato di queste funzionalità in caso di scenari e necessità più specifiche.
DPM 2010, rispetto alla precedente versione (DPM 2007), ha aggiunto la capacità di autohealing che permette a DPM 2010 di rilevare e di rendere le repliche delle nostre datasources che stiamo proteggendo, consistenti in modo automatico e affidabile con lo stato attuale delle datasources stesse presenti sui nostri server protetti.
Le tre principali funzioni di autohealing presenti in DPM, sono l’Auto-grow, l’Auto-CC (Consistency check) e l’Auto-rerun.
Auto-Grow
L’Auto-grow è la capacità di DPM 2010, di gestire e di ampliare autonomamente l’eventuale esaurimento di spazio disponibile sui volumi separati delle repliche e dei recovery point, o dei volumi che includono sia e più repliche che recovery point (nel caso si utilizzi la co-location su disco).
DPM 2010 rileva questo possibile problema al raggiungimento di una determinata percentuale di soglia sullo spazio occupato (90% dello spazio occupato per un determinato volume) e l’Auto-grow è usufruibile solo per i dischi contenuti nello Storage Pool sul server DPM 2010 (i custom volumes non permettono di utilizzare questa funzione in quanto la loro gestione non viene seguita da DPM 2010 ma è in carico all’utente finale tramite lo snap-in di Disk Management del sistema operativo)
L’abilitazione dell’Auto-grow può essere effettuata sia durante la creazione del protection group che dopo la creazione del protection group.
a) durante la creazione del protection group si può selezionare l’opzione per abilitare l’Auto-grow durante il wizard “Create new protection group”:
b) se durante la creazione iniziale del protection group, l’Auto-grow non fosse stato abilitato, è possibile abilitarlo selezionando la datasource e scegliendo “modifying disk allocation” . Da questa schermata, si può abilitare l’Auto-grow come dal seguente esempio:
Tramite l’Auto-grow è possibile impostare una dimensione di estensione o una percentuale di incremento dello spazio totale di determinati volumi per le repliche e i recovery point, che DPM 2010 implementerà appena avrà rilevato che ci sia un problema di esaurimento dello spazio disponibile evitando che le repliche non possano essere aggiornate e che i recovery point non vengano creati correttamente in base alle schedulazioni dei nostri protection group.
Consiglio di verificare con i vostri vendor SAN/HW, la possibilità e la capacità di estendere e accorciare la dimensioni dei dischi fissi che andrete ad utilizzare con DPM 2010 in fase di progetto/preventivo per evitare di non sfruttare pienamente la funzione di Auto-grow in fase di produzione.
Auto-CC
L’Auto-CC, o auto-consinstency check, è una funzionalità che permette a DPM 2010 di innescare un’altro consinstency check dopo 15 minuti trascorsi i quali il primo consinstency check schedulato non fosse andato a buon fine.
Il consinstency check è una funzionalità che può essere attivata nella configurazione del protection group e che viene eseguita quando DPM 2010 rileva, per qualsiasi causa, che la replica di una determinata datasource non è consistente con lo stato attuale della datasource presente su un determinato server protetto.
L’operazione di consistency check consiste nella creazione di un valore hash univoco, tramite uno specifico algoritmo di hashing,
sui vari blocchi di dimensione fissa delle datasources presenti sui nostri server protetti.
Questo valore viene trasferito e inviato al server DPM che utilizzerà il medesimo algoritmo di hashing sul blocco di dati che risiede
nella relativa replica per la specifica datasource, e che corrisponde al medesimo blocco su cui il server protetto ha calcolato e inviato il valore di hash.
Nel caso in cui i due valori di hash siano identici, DPM 2010 notificherà il DPM agent sul server protetto e si effettueranno le medesime operazioni sui successivi blocchi di dati delle nostre datasources.
Se invece i due valori di hash saranno diversi (gli algoritmi di hashing generano dei valori alfanumerici univoci sugli stessi blocchi di dati/informazioni) DPM 2010 rileverà un’inconsistenza tra i dati contenuti nelle repliche e quelli contenuti nelle datasources sui server protetti in quanto questi dati hanno una differenza tra loro.
DPM 2010 in seguito notificherà al DPM agent la richiesta di trasferimento del blocco di dati su cui ha rilevato una discrepanza
sui valori di hash calcolati, andando così ad aggiornare la relativa replica ripristinando la consistenza tra i dati della replica e quelli della datasource del nostro server protetto.
E’ consigliabile effettuare/schedulare le operazioni di consistency check in orari di scarsa attività (dopo le ore di lavoro)
in quanto potrebbero avere un impatto sulle performance dei server protetti e degradare le performance delle applicazioni/servizi utilizzati dagli utenti finali.
Esiste una chiave di registro di DPM 2010, che consente di specificare e impostare il numero di ritentativi massimi che DPM dovrà effettuare per i consinstency check (nel caso la chiave non fosse presente è necessario aggiungerla manualmente):
HKLM\Software\Microsoft\Microsoft Data Protection Manager\Configuration
Nome Chiave: AutoCCNumberOfAttempts
Tipo: DWORD
Impostazioni controllate: Il numero di volte che DPM cercherà di risolvere uno stato di inconsistenza di una replica prima di stabilire che il job di consistency check sia fallito definitivamente
Implicazioni: il default è 1. L’aumento di questo valore può aumentare il carico sull’intero sistema in proporzione al numero di datasource e al numero di inconsistenze sulle repliche
Auto-rerun
L’Auto-rerun è un miglioramento incluso in DPM 2010 che permetterà di eseguire un job schedulato (creazione e consolidamento dei recovery point) che falliranno al primo tentativo.
Tenete in considerazione i seguenti aspetti per questa funzionalità:
L’auto-rerun ha un ritardo tra due tentativi di un’ora per default.
L’auto-rerun non sarà effettuato se un’altro job è schedulato entro quattro ore o per qualsiasi job con funzioni particolari di DPM 2010.
il numero di ritentativi di default è 1. Questo valore può essere cambiato tramite una chiave di registro
L’auto-rerun sarà innescato quando vengono sollevati i seguenti alert nella console di amministrazione di DPM 2010:
la creazione dei recovery point per una data replica non è avvenuta con success
il consolidamento dei recovery point per le repliche non è avvenuto con successo
(ad esempio, mancato salvataggio dei recovery point nel relativo volume per mancanza di spazio disponibile)
5. Nel caso in cui fosse abilitato il consinstency check nel protection group che include un job di recovery point non andato a buon fine, DPM effettuerà instantaneamente un consistency check per ripristinare lo stato di consistenza di una data replica e permettere di effettuare la creazione del recovery point in un secondo momento.
Questa è la chiave di registro che consente di modificare il numero di ritentativi per l’Auto-rerun (nel caso la chiave non fosse presente è necessario aggiungerla manualmente):
HKLM\Software\Microsoft\Microsoft Data Protection Manager\Configuration
Nome Chiave: AutoRerunNumberOfAttempts
Tipo: Dword
Impostazioni controllate: il numero di tentativi che verranno effettuati in caso un job sia fallito al primo tentativo schedulato, prima che DPM 2010 consideri questo job definitivamente non andato a buon fine.
Implicazioni: il valore di default è 1. L’aumento del valore può aumentare il carico sull’intero sistema. I ritentativi vengono effettuati in base ad un ritardo configurabile con la chiave di registro AutoRerunDelay.
Nome Chiave: AutoRerunDelay
Tipo: DWORD
Impostazioni controllate: il ritardo in termini di tempo prima che DPM tenterà automaticamente di rieseguire i job non andati a buon fine.
Implicazioni: Questo valore dovrebbe essere cambiato se si hanno dei downtime previsti per i server di produzione o per gli ambienti di rete dove sono presenti i server DPM e quelli protetti, che eccedono il valore di 60 minuti. Se vengono configurati ritentativi multipli questa chiave imposterà il ritardo tra un ritentativo e l’altro. Se il valore di questa chiave viene impostato a zero, DPM rieseguirà il job non andato a buon fine immediatamente.
E’ consigliabile utilizzare le impostazioni predefinite di DPM 2010 per l’autohealing e di valutare attentamente una relativa modifica in base agli specifici scenari e necessità dei vostri ambienti di produzione/sviluppo.
Spero di avervi fornito ulteriori informazioni sulle nuove funzionalità di DPM 2010 e sul loro utilizzo.
Aspetto vostri eventuali commenti e richieste di approfondimento sugli argomenti trattati in questo post.
Ciao e alla prossima
Filippo Ceruti
Support Engineer
Microsoft Enterprise Platform Support