Quando usare Azure Data Factory

Completato

In questa unità viene spiegato come determinare se Azure Data Factory è una soluzione di integrazione dei dati adatta per la propria organizzazione. Si valuta Azure Data Factory in base ai criteri seguenti:

  • Requisiti per l'integrazione dei dati
  • Codifica delle risorse
  • Supporto per più origini dati
  • Infrastruttura serverless

Criteri decisionali

Per determinare se usare Azure Data Factory, usare i criteri descritti nella tabella seguente.

Criteri Analisi
È necessaria l'integrazione dei dati? Se l'organizzazione lavora con i Big Data o è un'organizzazione di data warehouse relazionale tradizionale, si potrebbe essere interessati a una soluzione di integrazione dei dati.
Sono disponibili le risorse di codifica necessarie? Non tutti gli utenti che lavorano con i dati sono esperti di scrittura del codice. Alcuni potrebbero preferire l'uso di strumenti grafici che offrono visualizzazioni in cui è possibile creare le attività che funzionano con i dati di origine.
È necessario usare più origini dati? Alcune organizzazioni potrebbero archiviare i dati non elaborati in svariati sistemi, sia locali che basati sul cloud. Una soluzione di analisi dei dati deve essere in grado di connettersi facilmente a molte origini dati.
È possibile creare, gestire ed effettuare la manutenzione di componenti di integrazione dei dati separati? Senza un servizio gestito per l'analisi dei dati, le aziende devono creare componenti di spostamento dei dati personalizzati. In alternativa, possono creare servizi personalizzati per integrare le origini dati e l'elaborazione. Integrare e mantenere tali sistemi può essere costoso e difficile. Inoltre, non in tutti questi sistemi sono disponibili il monitoraggio, gli avvisi e i controlli offerti da un servizio completamente gestito.

Applicare i criteri

Esaminare le domande seguenti se si pensa di usare Azure Data Factory come soluzione di integrazione dei dati.

È necessaria l'integrazione dei dati?

Se l'organizzazione è di piccole dimensioni e funziona con poche origini dati, potrebbe non essere necessario un servizio di integrazione dei dati. Se invece l'organizzazione lavora con i Big Data o è un'organizzazione di data warehouse relazionale tradizionale, una soluzione di integrazione dei dati può offrire dei vantaggi. Considerare gli aspetti seguenti:

  • Le organizzazioni con Big Data si basano su tecnologie per la gestione di grandi quantità di dati di vario tipo. Per questa community, Azure Data Factory è un modo per creare ed eseguire pipeline nel cloud. Queste pipeline possono accedere ai servizi dati sia cloud che locali. Queste pipeline in genere funzionano con tecnologie come Azure Synapse Analytics, BLOB di Azure e Azure Data Lake. Azure HDInsight, Azure Databricks e Azure Machine Learning.
  • Le organizzazioni di data warehouse relazionale in genere si affidano a tecnologie come SQL Server. SQL Server Integration Services (SSIS) viene spesso usato per creare pacchetti SSIS. Per queste organizzazioni, Azure Data Factory offre la possibilità di eseguire i pacchetti SSIS in Azure, consentendo in tal modo l'accesso ai servizi dati sia cloud che locali.

Sono disponibili le risorse di codifica necessarie?

Se nell'organizzazione non sono disponibili le risorse di codifica necessarie per creare le attività richieste, prendere in considerazione Azure Data Factory. Azure Data Factory mette a disposizione un processo low-code/no-code per l'uso delle origini dati e delle attività correlate. Ad esempio, lo strumento di creazione e monitoraggio di Azure Data Factory consente di creare pipeline graficamente trascinando e rilasciando le attività in un'area di progettazione. Lo screenshot seguente illustra l'interfaccia in cui un data engineer sta creando una pipeline con diverse attività:

Screenshot che illustra lo strumento di creazione e monitoraggio di Azure Data Factory.

È necessario usare più origini dati?

Se l'organizzazione ha la necessità di accedere ai dati in più posizioni e da più origini, occorre prendere in considerazione una soluzione di integrazione dei dati che offra questo supporto. Azure Data Factory usa connettori per l'integrazione con origini dati di vario tipo. Attualmente sono supportate più di 90 origini dati. Inoltre, Azure Data Factory supporta opzioni estendibili per raggiungere altre origini dati.

È possibile creare, gestire ed effettuare la manutenzione di componenti di integrazione dei dati separati?

La creazione e la gestione di una soluzione di integrazione dei dati basata su server possono essere complesse e richiedere molto tempo. Tuttavia, se si esegue una soluzione di questo tipo all'interno del data center dell'organizzazione, non è necessario prendere in considerazione Azure Data Factory. Tuttavia, l'uso di una soluzione serverless completamente gestita per l'integrazione dei dati presenta diversi vantaggi. I vantaggi principali includono:

  • Possibilità di dimensionare in base alle esigenze per supportare altri carichi di lavoro.
  • Non è necessario distribuire, configurare e gestire dei server per ospitare i carichi di lavoro di integrazione dei dati.

Riepilogo

In breve, prendere in considerazione Azure Data Factory quando si soddisfa uno o più dei criteri seguenti:

  • I data engineer non hanno il tempo necessario per creare codice per eseguire le attività di analisi dei dati.
  • Si hanno più origini dati in svariate posizioni.
  • Si vuole usufruire di una soluzione completamente gestita e basata sul cloud.