Condividi tramite


Scegliere la configurazione di runtime di integrazione corretta per lo scenario

Il runtime di integrazione (IR) è l'infrastruttura di calcolo usata da Microsoft Purview per alimentare l'analisi dei dati in ambienti di rete diversi. Questo articolo presenta i diversi tipi di runtime di integrazione disponibili in Microsoft Purview e fornisce indicazioni su come scegliere la configurazione del runtime di integrazione appropriata per lo scenario.

Tipi di runtime di integrazione

Microsoft Purview offre i tipi di runtime di integrazione seguenti:

  • Runtime di integrazione di Azure: il runtime di integrazione di Azure è un calcolo completamente gestito ed elastico che è possibile usare per analizzare le origini dati di Azure o non Azure. Il runtime di integrazione di Azure supporta le connessioni agli archivi dati e ai servizi di calcolo con endpoint accessibili pubblicamente. È il runtime di integrazione predefinito che non è necessario creare nulla per iniziare.
  • Runtime di integrazione di Rete virtuale gestite (VNet): è possibile creare un runtime di integrazione della rete virtuale gestita, che si trova in un Rete virtuale gestito di Microsoft Purview. Può usare endpoint privati per connettersi e analizzare in modo sicuro le origini dati supportate. Per altre informazioni, vedere Managed Rete virtuale e managed private endpoints (Endpoint privati gestiti).
  • Runtime di integrazione self-hosted: il runtime di integrazione self-hosted può essere usato per analizzare le origini dati in una rete locale o in una rete virtuale. È possibile installarlo in un computer locale o in una macchina virtuale all'interno della rete privata. Per altre informazioni , vedere Creare e gestire runtime di integrazione self-hosted.
  • Runtime di integrazione self-hosted supportato da Kubernetes (anteprima): questo runtime di integrazione è ospitato in un cluster Kubernetes e può essere usato per analizzare le origini dati in una rete locale o in una rete virtuale. Il supporto di Kubernetes migliora le prestazioni complessive e consente al runtime di integrazione di ridimensionarsi con il processo. Per altre informazioni , vedere Creare e gestire runtime di integrazione self-hosted supportati da Kubernetes
  • Runtime di integrazione AWS: il runtime di integrazione AWS è un runtime di integrazione completamente gestito ed elastico ospitato da Microsoft Purview in AWS. È applicabile durante l'analisi di origini dati Amazon come S3, RDS.

Scegliere il runtime di integrazione corretto

È importante scegliere un tipo appropriato di runtime di integrazione. Non solo deve essere adatto all'architettura e ai requisiti esistenti per l'integrazione dei dati, ma è anche necessario considerare come soddisfare ulteriormente le crescenti esigenze aziendali e qualsiasi aumento futuro del carico di lavoro.

La considerazione seguente consente di esplorare la decisione:

  1. Quali tipi di origine dati si desidera analizzare?

    Controllare la sezione origini dati supportate per informazioni sui tipi di runtime di integrazione supportati per le origini dati da analizzare.

  2. Qual è il controllo di accesso alla rete nell'origine dati?

    Un'origine dati diversa può avere impostazioni firewall di rete diverse per proteggerla dall'accesso casuale tramite Internet, può trattarsi di un archivio dati locale o cloud/SaaS. Nella tabella seguente sono elencate alcune opzioni comuni del firewall. È possibile scegliere il tipo di runtime di integrazione supportato in base allo scenario.

    Firewall origine dati Runtime di integrazione di Azure Runtime di integrazione rete virtuale gestita SHIR SHIR supportato da Kubernetes
    Consentire l'accesso pubblico
    Consentire il servizio di Azure o il servizio attendibile
    Consentire l'accesso da una rete virtuale di Azure specifica ✓ (con supporto dell'endpoint privato gestito)
    Consenti intervallo IP/IP specifico
    Altro accesso alla rete locale o privato
  3. Qual è l'impostazione del firewall di Microsoft Purview?

    Microsoft Purview offre diverse opzioni del firewall di rete. Per altre informazioni , vedere Configurare il firewall Microsoft Purview. È possibile scegliere il tipo di runtime di integrazione supportato in base allo scenario.

    Firewall Purview Runtime di integrazione di Azure Runtime di integrazione rete virtuale gestita SHIR SHIR supportato da Kubernetes
    Abilitato da tutte le reti
    Disabilitato da tutte le reti ✓ (endpoint privato gestito obbligatorio) ✓ (è necessario creare un endpoint privato dalla rete) ✓ (è necessario creare un endpoint privato dalla rete)
  4. Quale livello di sicurezza è necessario durante la trasmissione dei dati?

    Il percorso del runtime di integrazione definisce il percorso del calcolo back-end e la posizione in cui vengono eseguite le operazioni di analisi. Per considerazioni sulla residenza dei dati:

    • Quando si usa Il runtime di integrazione di Azure, Microsoft Purview rileva automaticamente la posizione dell'origine dati e usa il runtime di integrazione in tale area. Se Microsoft Purview non è in grado di rilevare l'area, usa l'area dell'account Purview.
    • Quando si usa il runtime di integrazione rete virtuale gestita, viene eseguito nell'area configurata per la rete virtuale gestita.
    • Quando si usa SHIR, è possibile decidere completamente la posizione nelle macchine virtuali locali o di Azure.

    Per difendersi, ad esempio, da attacchi man-in-the-middle durante la trasmissione dei dati, è possibile scegliere di usare un endpoint privato e collegamento privato per garantire la sicurezza dei dati.

    • È possibile creare endpoint privati gestiti negli archivi dati quando si usa il runtime di integrazione della rete virtuale gestita. Gli endpoint privati vengono gestiti dal servizio Microsoft Purview all'interno della rete virtuale gestita.
    • È anche possibile creare endpoint privati nella rete virtuale e SHIR può usarli per accedere agli archivi dati.
  5. Quale livello di manutenzione è in grado di fornire?

    La gestione di infrastruttura, server e apparecchiature è una delle attività importanti del reparto IT di un'azienda. In genere richiede molto tempo e fatica.

    • Quando si usa Il runtime di integrazione di Azure e il runtime di integrazione della rete virtuale gestita, non è necessario preoccuparsi della manutenzione, ad esempio aggiornamento, patch e versione. Il servizio Microsoft Purview si occupa di tutte le attività di manutenzione.
    • Poiché SHIR è installato nei computer e lo SHIR supportato da Kubernetes si trova nei cluster Kubernetes, è necessario gestire la manutenzione.
  6. Prestazioni e scalabilità

    È consigliabile usare il runtime di integrazione self-hosted completamente gestito e con scalabilità automatica di Azure, il runtime di integrazione della rete virtuale gestita o il runtime di integrazione self-hosted supportato da Kubernetes, quando applicabile. Grazie all'elasticità, possono offrire prestazioni e scalabilità migliori, soprattutto durante l'analisi di sistemi dati su larga scala.

Origini dati supportate

La tabella seguente mostra tutte le origini dati supportate dall'analisi di Microsoft Purview e i tipi di runtime di integrazione supportati.

Categoria Archivio dati supportato Azure IR/AWS IR Runtime di integrazione rete virtuale gestita SHIR Kubernetes SHIR
Azure Più origini
Archiviazione BLOB di Azure ✓ (incluso l'endpoint privato gestito)
Azure Cosmos DB (API per NoSQL) ✓ (incluso l'endpoint privato gestito)
Esplora dati di Azure ✓ (solo v2)
Azure Data Lake Storage Gen1 ✓ (solo v2)
Azure Data Lake Storage Gen2 ✓ (incluso l'endpoint privato gestito)
Azure Database per MySQL ✓ (incluso l'endpoint privato gestito)
Database di Azure per PostgreSQL ✓ (incluso l'endpoint privato gestito)
Azure Databricks Hive Metastore
Catalogo Unity Azure Databricks ✓ (solo v2, incluso l'endpoint privato gestito)
Pool SQL dedicato di Azure (in precedenza SQL Data Warehouse) ✓ (incluso l'endpoint privato gestito)
File di Azure ✓ (incluso l'endpoint privato gestito)
database SQL di Azure ✓ (incluso l'endpoint privato gestito)
Istanza gestita di SQL di Azure ✓ (incluso l'endpoint privato gestito)
Azure Synapse Analytics (area di lavoro) ✓ (incluso l'endpoint privato gestito)
Database Amazon RDS
Amazon Redshift
Cassandra ✓ (solo v2)
Db2
Google BigQuery
Hive Metastore Database
MongoDB
MySQL ✓ (solo v2, incluso l'endpoint privato gestito)
Oracle
PostgreSQL ✓ (solo v2)
SAP Business Warehouse
SAP HANA
Fiocco di neve ✓ (solo v2)
SQL Server
SQL Server in Azure-Arc
Teradata
File Amazon S3
HDFS
Servizi e app Dataverse ✓ (solo v2)
Erwin
Looker ✓ (solo v2)
Tessuto ✓ (solo v2)
Power BI ✓ (solo v2)
Qlik Sense ✓ (solo v2)
Salesforce ✓ (solo v2)
SAP ECC
SAP S/4HANA
Tableau ✓ (solo v2)