Replica e sincronizzazione di file mainframe in Azure

Azure Data Factory
Azure Data Lake
database SQL di Azure
Archiviazione di Azure
Macchine virtuali di Azure

Idee per soluzioni

In questo articolo viene descritta un'idea di soluzione. Il cloud architect può usare queste linee guida per visualizzare i componenti principali di un'implementazione tipica di questa architettura. Usare questo articolo come punto di partenza per il design di una soluzione ben progettata che sia in linea con i requisiti specifici del carico di lavoro.

Quando si esegue la migrazione di un'applicazione mainframe o midrange locale ad Azure, il trasferimento dei dati è una considerazione primaria. Diversi scenari di modernizzazione richiedono la replica dei file in Azure rapidamente o la gestione della sincronizzazione tra file locali e file di Azure.

Questo articolo descrive diversi processi per il trasferimento di file in Azure, la conversione e la trasformazione dei dati dei file e l'archiviazione dei dati in locale e in Azure.

Architettura

Il diagramma seguente illustra alcune delle opzioni per la replica e la sincronizzazione dei file locali in Azure:

Diagramma che illustra i tre passaggi della migrazione dei file locali ad Azure: trasferimento, conversione e trasformazione e archiviazione in un archivio permanente.

Scaricare un file di Visio di questa architettura.

Flusso di dati

  1. Trasferire file in Azure:

    • Il modo più semplice per trasferire i file in locale o in Azure consiste nell'usare FTP (File Transfer Protocol). È possibile ospitare un server FTP in una macchina virtuale (VM) di Azure. Un semplice linguaggio JCL (Job Control Language) FTP invia file ad Azure in formato binario, che è essenziale per mantenere i tipi di dati mainframe e midrange e dati binari. È possibile archiviare file trasmessi in dischi locali, archiviazione file di macchine virtuali di Azure o Archiviazione BLOB di Azure.

    • È anche possibile caricare file locali nell'archiviazione BLOB usando strumenti come AzCopy.

    • Il connettore FTP/SFTP di Azure Data Factory può essere usato anche per trasferire i dati dal sistema mainframe all'archiviazione BLOB. Questo metodo richiede una macchina virtuale intermedia in cui è installato un runtime di integrazione self-hosted.

    • È anche possibile trovare strumenti di terze parti in Azure Marketplace per trasferire i file dai mainframe ad Azure.

  2. Orchestrare, convertire e trasformare i dati:

    • Azure non è in grado di leggere i file della tabella codici IBM Extended Binary Coded Decimal Interchange Code (EBCDIC) nei dischi delle macchine virtuali di Azure o nell'archiviazione BLOB. Per rendere compatibili questi file con Azure, Host Integration Server (HIS) li converte da EBCDIC al formato American Standard Code for Information Interchange (ASCII).

      I copybook definiscono la struttura dei dati dei file COBOL, PL/I e del linguaggio assembly. HIS converte questi file in ASCII in base ai layout del copybook.

    • Prima di trasferire i dati negli archivi dati di Azure, potrebbe essere necessario trasformare i dati o usarli per l'analisi. Data Factory può gestire queste attività ETL (extract-transform-load) e extract-load-transform (ELT) e archiviare i dati direttamente in Azure Data Lake Storage.

    • Per le integrazioni di Big Data, Azure Databricks e Azure Synapse Analytics possono eseguire tutte le attività di trasformazione in modo rapido ed efficace usando il motore Apache Spark per eseguire calcoli in memoria.

  3. Archiviare i dati:

    È possibile archiviare i dati trasferiti in una delle diverse modalità di archiviazione di Azure persistenti disponibili, a seconda dei requisiti.

    • Se non è necessaria l'analisi, Azure Data Factory può archiviare i dati direttamente in un'ampia gamma di opzioni di archiviazione, ad esempio Data Lake Storage e Archiviazione BLOB.

    • Azure ospita diversi database, che rispondono a esigenze diverse:

      • I database relazionali includono la famiglia SQL Server e database open source come PostgreSQL e MySQL.
      • I database non relazionali includono Azure Cosmos DB, un database NoSQL veloce, multimodello, distribuito a livello globale.
  4. Esaminare analisi e business intelligence:

    Microsoft Fabric è una soluzione di analisi all-in-one che l'organizzazione può usare per studiare lo spostamento dei dati, sperimentare con le scienze dei dati ed esaminare analisi in tempo reale e business intelligence. Offre una suite completa di funzionalità, tra cui un data lake, la progettazione dei dati e l'integrazione dei dati.

Componenti

Vari scenari di trasferimento, integrazione e archiviazione dei file usano componenti diversi. Vedere il calcolatore dei prezzi di Azure per stimare i costi per le risorse di Azure.

Rete

Un gateway dati locale è un software bridge che connette i dati locali ai servizi cloud. È possibile installare il gateway in una macchina virtuale locale dedicata.

Integrazione e trasformazione dei dati

  • provider di dati per File host è un componente di HIS che converte i file della tabella codici EBCDIC in ASCII. Il provider può leggere e scrivere record offline in un file binario locale oppure usare Systems Network Architecture (SNA) o Transmission Control Protocol/TCP/IP (Transmission Control Protocol) per leggere e scrivere record in set di dati mainframe IBM z/OS remoti o i5/OS fisici. I connettori HIS sono disponibili per BizTalk e App per la logica di Azure.

  • Azure Data Factory è un servizio di integrazione dei dati ibrido che è possibile usare per creare, pianificare e orchestrare flussi di lavoro ETL ed ELT.

  • Azure Databricks è una piattaforma di analisi basata su Apache Spark ottimizzata per Azure. È possibile usare Databricks per correlare i dati in ingresso e arricchire i dati con altri dati archiviati in Databricks.

  • Azure Synapse Analytics è un data warehouse cloud veloce e flessibile con un'architettura MPP (Massively Parallel Processing) che è possibile usare per ridimensionare, calcolare e archiviare i dati in modo elastico e indipendente.

Database

  • database SQL di Azure è un servizio di database cloud relazionale scalabile. database SQL di Azure è sempre sempreverdi e sempre aggiornato, con funzionalità automatizzate e basate sull'intelligenza artificiale che ottimizzano le prestazioni e la durabilità. Le opzioni di calcolo serverless e di archiviazione con iperscalabilità ridimensionano automaticamente le risorse su richiesta. Con Vantaggio Azure Hybrid, è possibile usare le licenze di SQL Server locali esistenti nel cloud senza costi aggiuntivi.

  • Istanza gestita di SQL di Azure combina la compatibilità più ampia del motore di database di SQL Server con tutti i vantaggi di una piattaforma distribuita come servizio (PaaS) completamente gestita e sempreverdi. Con Istanza gestita di SQL, è possibile modernizzare le app esistenti su larga scala con strumenti, competenze e risorse familiari.

  • SQL Server in Azure Macchine virtuali lift-and-shift dei carichi di lavoro di SQL Server nel cloud per combinare la flessibilità e la connettività ibrida di Azure con prestazioni, sicurezza e analisi di SQL Server. È possibile accedere agli aggiornamenti e alle versioni più recenti di SQL Server con compatibilità del codice al 100%.

  • Database di Azure per PostgreSQL è un servizio di database relazionale completamente gestito basato sull'edizione community del motore di database PostgreSQL open source.

  • Database di Azure per MySQL è un servizio di database relazionale completamente gestito basato sull'edizione community del motore di database MySQL open source.

  • Azure Cosmos DB è un servizio di database NoSQL completamente gestito e multimodello per la creazione e la modernizzazione di applicazioni scalabili e ad alte prestazioni. Azure Cosmos DB ridimensiona la velocità effettiva e l'archiviazione in modo elastico e indipendente tra aree geografiche e garantisce latenze di millisecondi a cifra singola al 99° percentile ovunque nel mondo.

Altri archivi dati

  • Archiviazione BLOB archivia grandi quantità di dati non strutturati, ad esempio dati di testo o binari, a cui è possibile accedere da qualsiasi posizione tramite HTTP o HTTPS. È possibile usare l'archiviazione BLOB per esporre i dati pubblicamente o per archiviare i dati dell'applicazione privatamente.

  • Data Lake Storage è un repository di archiviazione che contiene una grande quantità di dati in formato nativo e non elaborato. Data Lake Storage offre scalabilità per carichi di lavoro di analisi dei Big Data con terabyte e petabyte di dati. I dati provengono in genere da più origini eterogenee e possono essere strutturati, semistrutturati o non strutturati.

Potenziali casi d'uso

I casi d'uso di replica e sincronizzazione dei file locali includono:

  • Dipendenze downstream o upstream, ad esempio se le applicazioni eseguite in un mainframe e le applicazioni eseguite in Azure devono scambiare dati tramite file.

  • Test paralleli di applicazioni rehosting o ricreate in Azure con applicazioni locali.

  • Applicazioni locali strettamente associate nei sistemi che non possono essere immediatamente corretti o modernizzati.

Collaboratori

Questo articolo viene gestito da Microsoft. Originariamente è stato scritto dai seguenti contributori.

Autori principali:

Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.

Passaggi successivi