Raccomandazioni di rete per Lakehouse Federation
Questo articolo fornisce indicazioni per la configurazione di un percorso di rete praticabile tra i cluster di Azure Databricks o sql warehouse e il sistema di database esterno a cui ci si connette tramite Lakehouse Federation.
Tenere presenti le informazioni importanti seguenti:
- Tutto il traffico di rete è direttamente tra cluster di Azure Databricks (o SQL Warehouse) e il sistema di database esterno. Il catalogo Unity o il piano di controllo di Azure Databricks non si trovano nel percorso di rete.
- Il calcolo di Azure Databricks( ovvero cluster e SQL Warehouse) viene sempre distribuito nel cloud, ma il sistema di database esterno può essere locale o ospitato in qualsiasi provider di servizi cloud, purché sia presente un percorso di rete funzionante tra il calcolo di Azure Databricks e il database esterno.
- Se sono presenti restrizioni di rete in ingresso o in uscita per il calcolo di Azure Databricks o il sistema di database esterno, fare riferimento alle sezioni seguenti per indicazioni generali che consentono di creare un percorso di rete praticabile.
Per altre informazioni sulla rete nelle aree di lavoro di Azure Databricks, vedere Rete.
Il sistema di database e Azure Databricks calcolano entrambi accessibili da Internet
La connessione deve funzionare senza alcuna configurazione.
Il sistema di database ha restrizioni di accesso alla rete
Se il sistema di database esterno ha restrizioni di accesso alla rete in ingresso o in uscita e il cluster Azure Databricks o SQL Warehouse è accessibile da Internet, configurare una delle soluzioni di rete seguenti per connettersi dalle risorse di calcolo classiche:
IP in uscita stabile nel calcolo di Azure Databricks.
Dal piano di calcolo classico configurare un indirizzo IP stabile con un servizio di bilanciamento del carico, un gateway NAT, un gateway Internet o un equivalente e connetterlo alla subnet in cui viene distribuito il calcolo di Azure Databricks. Ciò consente alla risorsa di calcolo di condividere un indirizzo IP pubblico stabile che può essere consentito sul lato del database esterno.
collegamento privato (solo quando il database esterno si trova nello stesso cloud di calcolo di Azure Databricks)
Dal piano di calcolo classico configurare una connessione collegamento privato tra la rete in cui viene distribuito il database e la rete in cui viene distribuito il calcolo di Azure Databricks.
Dal piano di calcolo serverless è supportato collegamento privato di Azure per il connettore SQL Server. Vedere Passaggio 3: creare le regole gli endpoint privati.
L'ambiente di calcolo di Azure Databricks presenta restrizioni di accesso alla rete
Se il sistema di database esterno è accessibile da Internet e il calcolo di Azure Databricks presenta restrizioni di accesso alla rete in ingresso o in uscita (che è possibile solo se si è in una rete gestita dal cliente), eseguire una delle configurazioni seguenti:
Consenti il nome host del database esterno nelle regole del firewall della subnet in cui viene distribuito il calcolo di Azure Databricks.
Se si sceglie di consentire l'elenco di indirizzi IP del database esterno anziché nome host, assicurarsi che il database esterno disponga di un indirizzo IP stabile.
collegamento privato (solo quando il database esterno si trova nello stesso cloud dell'ambiente di calcolo di Azure Databricks)
Configurare una connessione collegamento privato tra la rete in cui viene distribuito il database e la rete in cui viene distribuito il calcolo di Azure Databricks.
L'ambiente di calcolo di Azure Databricks ha un server DNS personalizzato
Se il sistema di database esterno è accessibile da Internet e il calcolo di Azure Databricks dispone di un server DNS personalizzato (che è possibile solo se si è in una rete gestita dal cliente), aggiungere il nome host del sistema di database al server DNS personalizzato in modo che possa essere risolto.