Quando usare la famiglia di prodotti Azure Data Box

Completato

I dispositivi della famiglia Azure Data Box non sono gli unici strumenti per spostare i dati in Azure. Per i dati dei veicoli autonomi, si vuole assicurarsi che Data Box Disk sia la scelta migliore prima di effettuare un ordine.

In questa unità verrà illustrato quando usare un dispositivo Data Box e quando optare per un'altra soluzione.

Casi d’uso per i dispositivi Data Box

Data Box è ideale per trasferire terabyte di dati in scenari con connettività di rete limitata o assente. Lo spostamento dati può avvenire una tantum, periodicamente oppure tramite un trasferimento dei dati in blocco iniziale seguito da trasferimenti periodici.

Ecco i vari scenari in cui è possibile usare i dispositivi Data Box per importare dati in Azure.

  • Migrazione una tantum: quando si spostano grandi quantità di dati locali in Azure.

    • Spostamento di una libreria multimediale da nastri offline in Azure per creare una libreria multimediale online.
    • Migrazione della farm della VM, di SQL Server e di applicazioni ad Azure.
    • Spostamento dei dati cronologici in Azure per un'analisi approfondita e la generazione di report con HDInsight.
  • Trasferimento in blocco iniziale: quando si esegue un trasferimento in blocco iniziale usando Data Box (valore di inizializzazione) seguito da trasferimenti incrementali nella rete.

  • Caricamenti periodici: quando vengono generate periodicamente grandi quantità di dati che è necessario spostare in Azure. Ad esempio nella prospezione di fonti energetiche, in cui vengono generati contenuti video negli impianti di trivellazione e nelle installazioni di turbine a vento.

Ecco i vari scenari in cui è possibile usare Data Box per esportare i dati da Azure. Data Box Disk e Data Box Heavy non supportano l'esportazione di dati da Azure.

  • Ripristino di emergenza: quando una copia dei dati di Azure viene ripristinata in una rete locale. In uno scenario di ripristino di emergenza tipico vengono esportate grandi quantità di dati di Azure in un dispositivo Data Box. Microsoft spedisce quindi questo dispositivo Data Box e i dati vengono ripristinati in locale entro breve tempo.

  • Requisiti di sicurezza: quando è necessario avere la possibilità di esportare i dati da Azure per soddisfare requisiti governativi o di sicurezza. Archiviazione di Azure è ad esempio disponibile nei cloud US Secret e Top Secret ed è possibile usare Data Box per esportare i dati da Azure.

  • Migrazione nell'ambiente locale o passaggio a un altro provider di servizi cloud: quando si vogliono spostare tutti i dati di nuovo in locale o li si vuole trasferire a un altro provider di servizi cloud, è possibile esportare i dati tramite Data Box per eseguire la migrazione dei carichi di lavoro.

Opzioni di trasferimento offline

Le opzioni offline per spostare i dati in Azure includono dispositivi Data Box e Importazione/Esportazione di Microsoft Azure.

Dispositivi Data Box

Per spostare i dati in Azure, è possibile caricarli su dispositivi fisici e inviarli a un data center di Azure. Qui i dati verranno copiati nella sottoscrizione di Azure. Come illustrato nell'unità 2, per questo tipo di trasferimento è possibile usare tre prodotti Data Box:

  • Data Box
  • Data Box Disk
  • Data Box Heavy

Se ci si trova in un'area non supportata dalla famiglia di prodotti Azure Data Box, valutare la possibilità di usare la funzionalità Importazione/Esportazione di Azure per importare i dati in Azure.

Importazione/Esportazione di Azure

L'altro servizio che usa dispositivi fisici per trasferire i dati in Azure è Importazione/Esportazione di Azure. Importazione/Esportazione di Azure consente di usare i dischi dell'utente. I dati possono essere trasferiti offline da Archiviazione BLOB nei dischi. Importazione/Esportazione di Azure consente anche di esportare i dati da Azure nei data center locali, nonché di trasferirli attraverso i confini internazionali.

La procedura di configurazione per l'importazione dei dati tramite Importazione/Esportazione di Azure è più complessa rispetto alla famiglia di prodotti Azure Data Box. È necessario gestire tutti i dettagli di spedizione e preparare il dispositivo. È consigliabile usare Azure Data Box, un servizio predefinito che riduce al minimo il lavoro richiesto per spostare grandi volumi di dati, in modo economico e sicuro, in Azure.

Opzioni di trasferimento tramite rete

Un altro metodo per spostare i dati in Azure consiste nell'inviarli attraverso Internet. Esistono diversi strumenti che è possibile usare per trasferire i dati tramite la rete.

Data Box Gateway

Come illustrato nell'unità 2, Data Box Gateway è un'appliance virtuale. basata su una macchina virtuale di cui si esegue il provisioning nell'ambiente locale. È possibile scrivere i dati nel dispositivo virtuale usando i protocolli NFS e SMB. Il dispositivo trasferisce quindi i dati in BLOB in blocchi, BLOB di pagine o File di Azure.

Azure Storage Explorer

Azure Storage Explorer è un'applicazione scaricabile gratuitamente che può essere eseguita in Windows, Mac o Linux. Offre un'interfaccia utente grafica (GUI) per esplorare BLOB, file, code e tabelle negli account di Archiviazione di Azure. Se si trasferiscono solo pochi file per volta e non è necessario automatizzare i trasferimenti, Storage Explorer rappresenta una soluzione ideale.

Se non si vuole installare un'applicazione, ma si ha a disposizione un browser, è possibile usare la pagina di Storage Explorer nel portale di Azure per trasferire i file.

Azure Stack Edge

Anche Azure Stack Edge usa i dispositivi fisici per trasferire i dati in Azure. A differenza dei dispositivi Data Box, i dispositivi Azure Stack Edge offrono funzionalità di calcolo, archiviazione, rete e Machine Learning con accelerazione hardware in qualsiasi posizione perimetrale. Usare un dispositivo Azure Stack Edge per gli scenari seguenti:

  • Inferenza con Azure Machine Learning: eseguire modelli di Machine Learning per ottenere risultati rapidi in base a cui intervenire prima che i dati vengano inviati al cloud. Facoltativamente, è possibile trasferire il set di dati completo per continuare a ripetere il training dei modelli di Machine Learning e migliorarli.

  • Pre-elaborare i dati: trasformare i dati tramite opzioni di calcolo come contenitori o macchine virtuali prima dell'invio ad Azure per creare un set di dati su cui intervenire. È possibile usare la pre-elaborazione per:

    • Aggregare i dati.
    • Modificare i dati, ad esempio per rimuovere i dati personali.
    • Suddividere i dati in subset per ottimizzare l'archiviazione e la larghezza di banda o per ulteriori analisi.
    • Analizzare e rispondere a eventi IoT.
  • Trasferire i dati sulla rete in Azure: trasferire rapidamente e facilmente i dati in Azure per eseguire ulteriori analisi ed elaborazioni o per scopi di archiviazione.

Azure Data Factory

Azure Data Factory è un servizio che consente di organizzare, spostare e trasformare grandi quantità di dati da molte origini diverse. In Data Factory è possibile creare pipeline di dati che inseriscono dati provenienti da database relazionali, database NoSQL e altri sistemi. Per elaborare e trasformare tali dati, è possibile usare Azure Machine Learning, Hadoop, Spark e altri servizi. Alla fine della pipeline è poi possibile pubblicare i dati trasformati in Azure SQL Data Warehouse, nel database SQL di Azure, in Azure Cosmos DB e in Archiviazione di Azure.

È possibile usare questo servizio se si hanno esigenze complesse per la trasformazione dei dati e si vuole evitare di scrivere script o compilare codice.

Trasferimento tramite script o a livello di codice

Microsoft offre una gamma di strumenti da riga di comando ottimizzati, che è possibile chiamare usando singoli comandi o assemblare in script e usare per spostare i dati in Azure. Questi strumenti includono:

  • AzCopy. È possibile chiamare questo strumento da riga di comando da qualsiasi script per trasferire BLOB o file in un account di Archiviazione di Azure.
  • Azure PowerShell. PowerShell è un'interfaccia e un linguaggio di scripting progettato per consentire agli amministratori di automatizzare attività complesse eseguendo comandi denominati cmdlet. Il modulo Azure PowerShell offre una serie di cmdlet per usare Azure, tra cui cmdlet per caricare i dati in account di Archiviazione di Azure, nel database SQL di Azure, in Azure Cosmos DB e in altre destinazioni. Per caricare ad esempio un file in un BLOB del servizio di archiviazione di Azure, usare il cmdlet Set-AzStorageBlobContent.
  • Interfaccia della riga di comando di Azure. L'interfaccia della riga di comando di Azure è uno strumento da riga di comando che è possibile chiamare da script PowerShell e Bash per interagire con Azure. Include opzioni che consentono di spostare i dati in varie posizioni di Azure. Usare ad esempio il comando az storage blob upload per caricare un file in un BLOB del servizio di archiviazione di Azure.

Gli strumenti di scripting sono facili da usare sia per gli amministratori che per utenti non sviluppatori. Chi ha competenze di sviluppo e sa scrivere codice compilato, può prendere in considerazione l'uso di linguaggi di programmazione per orchestrare il trasferimento dei dati in Azure. Il codice deve chiamare le API (Application Programming Interface) REST (Representational State Transfer) di Archiviazione di Azure. Le API REST sono un set di servizi Web che è possibile chiamare da molti linguaggi di programmazione diversi. Gli sviluppatori possono usare i linguaggi .NET, Java, Python, Node.js, PHP e molti altri per chiamare queste API. Gli sviluppatori possono scegliere il linguaggio con cui hanno più familiarità.

Scelta di un metodo per il trasferimento dei dati

Per scegliere un metodo per il trasferimento da questi sistemi, rispondere alle domande seguenti:

  • Quali sono le dimensioni dei dati?
  • Con quale frequenza si vogliono trasferire i dati?
  • Qual è la disponibilità della larghezza di banda di rete?

Se si vogliono trasferire pochi file occasionalmente, è possibile scegliere Azure Storage Explorer o usare il portale di Azure.

Se la larghezza di banda di rete disponibile è limitata o costosa e il volume di dati è elevato, è possibile usare un dispositivo fisico per trasferire i dati. Se si vogliono usare i dischi dell'utente, scegliere Importazione/Esportazione di Azure. Se si preferisce usare hardware Microsoft, optare per un prodotto Azure Data Box. È possibile scegliere tra Data Box, Data Box Disk e Data Box Heavy, in base ai volumi di dati massimi.

Se la larghezza di banda di rete disponibile è molto alta e si vogliono trasferire dati regolarmente o in modo continuo, è possibile scegliere un metodo di trasferimento di rete. Se si vogliono trasformare i dati durante il trasferimento senza usare codice, prendere in considerazione Azure Data Factory. Se si può investire tempo e si hanno le competenze necessarie per scrivere codice, è possibile usare gli strumenti di scripting o il codice compilato sviluppato per le API REST. Se si vogliono trasferire set di dati di grandi dimensioni tramite la rete e la larghezza di banda disponibile è elevata, è possibile scegliere Data Box Gateway o un dispositivo Azure Stack Edge.

Trasferimento dei dati per i veicoli autonomi

Nell'organizzazione si vogliono caricare i dati di telemetria dei veicoli autonomi in Azure in modo rapido, relativamente economico e sicuro, senza intasare la rete. Questo scenario è un caso di utilizzo ideale per Azure Data Box Disk.

È possibile usare Azure Data Box Disk per diversi tipi di scenari di trasferimento dei dati. Azure Data Box Disk è adatto per migrazioni da eseguire una sola volta, ad esempio in caso di spostamento di un massimo di 35 TB di dati da nastri offline in archiviazione ad accesso sporadico di Azure. Se si devono caricare più di 35 TB di dati, è possibile creare ordini aggiuntivi. Vale anche la pena riesaminare le altre opzioni della famiglia di prodotti Data Box illustrate nella prima unità perché potrebbe esserci un candidato più idoneo. Funzionano bene anche i trasferimenti incrementali. Data Box Disk viene usato per effettuare il seeding iniziale, di grandi dimensioni, dopo di ché vengono eseguite altre copie incrementali dei dati usando tecniche di rete standard.

Verificare le conoscenze

1.

Qual è il metodo di importazione dei dati migliore per importare dati video giornalieri di telecamera del traffico quando la larghezza di banda di rete disponibile è da moderata a elevata?

2.

Qual è la quantità massima di dati che è possibile trasferire in Azure in un'unica operazione tramite Azure Data Box Disk?

3.

Si ha un'enorme quantità di dati generati da dispositivi e applicazioni intelligenti nel data center. Si vuole eseguire un'inferenza rapida basata su Machine Learning dei dati prima che siano trasferiti in Azure per essere analizzati nel dettaglio. Quale dispositivo si deve usare?