Raccomandazioni di rete per Lakehouse Federation
Questo articolo fornisce indicazioni per la configurazione di un percorso di rete praticabile tra i cluster di Azure Databricks o sql warehouse e il sistema di database esterno a cui ci si connette tramite Lakehouse Federation.
Tenere presenti le informazioni importanti seguenti:
- Tutto il traffico di rete è direttamente tra cluster di Azure Databricks (o SQL Warehouse) e il sistema di database esterno. Il catalogo Unity o il piano di controllo di Azure Databricks non si trovano nel percorso di rete.
- Il calcolo di Azure Databricks( ovvero cluster e SQL Warehouse) viene sempre distribuito nel cloud, ma il sistema di database esterno può essere locale o ospitato in qualsiasi provider di servizi cloud, purché sia presente un percorso di rete funzionante tra il calcolo di Azure Databricks e il database esterno.
- Se sono presenti restrizioni di rete in ingresso o in uscita per il calcolo di Azure Databricks o il sistema di database esterno, fare riferimento alle sezioni seguenti per indicazioni generali che consentono di creare un percorso di rete praticabile.
Per altre informazioni sulla rete nelle aree di lavoro di Azure Databricks, vedere Rete.
Il sistema di database e Azure Databricks calcolano entrambi accessibili da Internet
La connessione deve funzionare senza alcuna configurazione.
Il sistema di database ha restrizioni di accesso alla rete
Se il sistema di database esterno ha restrizioni di accesso alla rete in ingresso o in uscita e il cluster Azure Databricks o SQL Warehouse è accessibile da Internet, configurare una delle soluzioni di rete seguenti per connettersi dalle risorse di calcolo classiche:
IP in uscita stabile nel calcolo di Azure Databricks.
Dal piano di calcolo classico, configura un indirizzo IP stabile tramite un servizio di bilanciamento del carico, un gateway NAT, un gateway Internet o equivalente, e connettilo alla subnet in cui viene distribuito Azure Databricks. Ciò consente alla risorsa di calcolo di condividere un indirizzo IP pubblico stabile che può essere consentito sul lato del database esterno.
collegamento privato (solo quando il database esterno si trova nello stesso cloud di calcolo di Azure Databricks)
Dal piano di calcolo classico, configurare una connessione Private Link tra la rete in cui viene distribuito il database e la rete in cui viene distribuito il compute di Azure Databricks.
Dal piano di calcolo serverless è supportato collegamento privato di Azure per il connettore SQL Server. Vedere Passaggio 3: creare le regole gli endpoint privati.
L'ambiente di calcolo di Azure Databricks presenta restrizioni di accesso alla rete
Se il sistema di database esterno è accessibile da Internet e il calcolo di Azure Databricks presenta restrizioni di accesso alla rete in ingresso o in uscita (che è possibile solo se si è in una rete gestita dal cliente), eseguire una delle configurazioni seguenti:
Consenti il nome host del database esterno nelle regole del firewall della subnet in cui viene distribuito il calcolo di Azure Databricks.
Se si sceglie di consentire l'elenco di indirizzi IP del database esterno anziché nome host, assicurarsi che il database esterno disponga di un indirizzo IP stabile.
collegamento privato (solo quando il database esterno si trova nello stesso cloud dell'ambiente di calcolo di Azure Databricks)
Configurare un collegamento privato tra la rete in cui viene implementato il database e la rete in cui viene implementato Azure Databricks.
L'ambiente di calcolo di Azure Databricks ha un server DNS personalizzato
Se il sistema di database esterno è accessibile da Internet e il calcolo di Azure Databricks dispone di un server DNS personalizzato (che è possibile solo se si è in una rete gestita dal cliente), aggiungere il nome host del sistema di database al server DNS personalizzato in modo che possa essere risolto.