Connettersi a Dataiku
Dataiku è una piattaforma di IA end-to-end per la preparazione dei dati, AutoML e MLOps. È possibile integrare i warehouse SQL Databricks e i cluster Azure Databricks con Dataiku.
Connettersi a Dataiku tramite Partner Connect
Nota
Partner Connect supporta solo i warehouse SQL per Dataiku. Per connettere un cluster a Dataiku, connettersi manualmente a Dataiku.
Per connettere l'area di lavoro Azure Databricks a Dataiku utilizzando Partner Connect, procedere come segue:
Nella barra laterale fare clic su Partner Connect.
Fare clic sul riquadro Partner.
Nota
Se nel riquadro Dataiku è presente un'icona con un segno di spunta, significa che un amministratore ha già utilizzato Partner Connect per collegare Dataiku all'area di lavoro. Andare direttamente al passaggio 5. Il partner utilizza l'indirizzo e-mail dell'account Azure Databricks per richiedere l'accesso all'account Dataiku esistente.
Select un catalog dall'elenco a discesa list, quindi fare clic su Avanti.
Nota
Se l'area di lavoro è abilitata alla Unity Catalog, ma il partner non supporta Unity Catalog con Partner Connect, viene utilizzato il valore predefinito catalog dell'area di lavoro. Se l'area di lavoro non è abilitata per Unity Catalog, viene utilizzato
hive_metastore
.Select un schema dall'elenco a discesa liste quindi fare clic su Aggiungi. È possibile ripetere questo passaggio per aggiungere più schemi.
Fare clic su Avanti.
Partner Connect crea le seguenti risorse nell'area di lavoro:
- Un’entità servizio di Azure Databricks denominata
<PARTNER>_USER
. - Un token di accesso personale di Azure Databricks associato all'entità servizio
<PARTNER>_USER
.
Partner Connect concede anche i seguenti privilegi seguenti all'entità servizio
<PARTNER>_USER
:- (Unity Catalog)
USE CATALOG
: necessario per interagire con gli oggetti all'interno del catalogselezionato. - (Unity Catalog)
USE SCHEMA
: concede la possibilità di leggere gli schemi che hai selezionato. - (Unity Catalog)
CREATE SCHEMA
: Conferisce la possibilità di creare schemi nel catalogselezionato. - (Metastore Hive legacy)
USAGE
: obbligatorio per interagire con gli oggetti all'interno dihive_metastore
e con gli schemi selezionati. - (Metastore Hive legacy)
CREATE
: concede la possibilità di creare un schema inhive_metastore
. - (Metastore Hive legacy) READ_METADATA: concede la possibilità di leggere i metadati per gli schemi selezionati.
- (Metastore Hive legacy) SELECT: concede la possibilità di leggere gli schemi selezionati.
- Un’entità servizio di Azure Databricks denominata
Fare clic su Avanti.
Nella casella Posta elettronica viene visualizzato l'indirizzo di posta elettronica per l'account Azure Databricks. Dataiku usa questo indirizzo di posta elettronica per richiedere di creare un nuovo account partner o di accedere all'account partner esistente.
Fare clic su Connetti a Dataiku oppure su Accedi.
Verrà visualizzata una nuova scheda nel Web browser, che visualizza il sito Web di Dataiku.
Completare le istruzioni visualizzate nel sito Web di Dataiku per creare l'account Dataiku di valutazione o accedere all'account Dataiku esistente.
Connettersi manualmente a Dataiku
Questa sezione descrive come collegare manualmente a Dataiku un warehouse o un cluster SQL esistente nell'area di lavoro di Azure Databricks.
Nota
Per i warehouse Databricks SQL, è possibile connettersi a Dataiku utilizzando Partner Connect per semplificare l'esperienza.
Requisiti
Prima di connettersi manualmente a Dataiku, è necessario quanto segue:
Un cluster o SQL Warehouse nell'area di lavoro di Azure Databricks.
I dettagli di connessione per il cluster o SQL Warehouse, in particolare il Server Hostname , la Porta , e il Percorso HTTP values.
Un token di accesso personale di Azure Databricks o un token Microsoft Entra ID (in precedenza Azure Active Directory). Per creare un token di accesso personale, seguire la procedura descritta in Token di accesso personali di Azure Databricks per gli utenti dell'area di lavoro.
Nota
Come procedura consigliata per la sicurezza, quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, Databricks consiglia di usare token di accesso personali appartenenti alle entità servizio, anziché agli utenti dell'area di lavoro. Per creare token per le entità servizio, consultare Gestire i token per un'entità servizio.
Passaggi per la connessione
Per connettersi manualmente a Dataiku, seguire Databricks nella documentazione di Dataiku.
Risorse aggiuntive
Esplorare le seguenti risorse di Dataiku: