Connettersi a Dataiku
Dataiku è una piattaforma di IA end-to-end per la preparazione dei dati, AutoML e MLOps. È possibile integrare i warehouse SQL Databricks e i cluster Azure Databricks con Dataiku.
Connettersi a Dataiku tramite Partner Connect
Nota
Partner Connect supporta solo i warehouse SQL per Dataiku. Per connettere un cluster a Dataiku, connettersi manualmente a Dataiku.
Per connettere l'area di lavoro Azure Databricks a Dataiku utilizzando Partner Connect, procedere come segue:
Nella barra laterale fare clic su Partner Connect.
Fare clic sul riquadro Partner.
Nota
Se nel riquadro Dataiku è presente un'icona con un segno di spunta, significa che un amministratore ha già utilizzato Partner Connect per collegare Dataiku all'area di lavoro. Andare direttamente al passaggio 5. Il partner utilizza l'indirizzo e-mail dell'account Azure Databricks per richiedere l'accesso all'account Dataiku esistente.
Selezionare un catalogo nell’elenco a discesa, poi fare clic su Successivo.
Nota
Se l'area di lavoro è abilitata al catalogo Unity, ma il partner non supporta il catalogo Unity con Partner Connect, viene utilizzato il catalogo predefinito dell'area di lavoro. Se l'area di lavoro non è abilitata per il catalogo Unity, si utilizza
hive_metastore
.Selezionare uno schema nell’elenco a discesa, poi fare clic su Aggiungi. È possibile ripetere questo passaggio per aggiungere più schemi.
Fare clic su Avanti.
Partner Connect crea le seguenti risorse nell'area di lavoro:
- Un’entità servizio di Azure Databricks denominata
<PARTNER>_USER
. - Un token di accesso personale di Azure Databricks associato all'entità servizio
<PARTNER>_USER
.
Partner Connect concede anche i seguenti privilegi seguenti all'entità servizio
<PARTNER>_USER
:- (Catalogo Unity)
USE CATALOG
: obbligatorio per interagire con gli oggetti all'interno del catalogo selezionato. - (Catalogo Unity)
USE SCHEMA
: concede la possibilità di leggere gli schemi selezionati. - (Catalogo Unity)
CREATE SCHEMA
: concede la possibilità di creare gli schemi nel catalogo selezionato. - (Metastore Hive legacy)
USAGE
: obbligatorio per interagire con gli oggetti all'interno dihive_metastore
e con gli schemi selezionati. - (Metastore Hive legacy)
CREATE
: concede la possibilità di creare uno schema inhive_metastore
. - (Metastore Hive legacy) READ_METADATA: concede la possibilità di leggere i metadati per gli schemi selezionati.
- (Metastore Hive legacy) SELECT: concede la possibilità di leggere gli schemi selezionati.
- Un’entità servizio di Azure Databricks denominata
Fare clic su Avanti.
Nella casella Posta elettronica viene visualizzato l'indirizzo di posta elettronica per l'account Azure Databricks. Dataiku usa questo indirizzo di posta elettronica per richiedere di creare un nuovo account partner o di accedere all'account partner esistente.
Fare clic su Connetti a Dataiku oppure su Accedi.
Verrà visualizzata una nuova scheda nel Web browser, che visualizza il sito Web di Dataiku.
Completare le istruzioni visualizzate nel sito Web di Dataiku per creare l'account Dataiku di valutazione o accedere all'account Dataiku esistente.
Connettersi manualmente a Dataiku
Questa sezione descrive come collegare manualmente a Dataiku un warehouse o un cluster SQL esistente nell'area di lavoro di Azure Databricks.
Nota
Per i warehouse Databricks SQL, è possibile connettersi a Dataiku utilizzando Partner Connect per semplificare l'esperienza.
Requisiti
Prima di connettersi manualmente a Dataiku, è necessario quanto segue:
Un cluster o SQL Warehouse nell'area di lavoro di Azure Databricks.
I dettagli di connessione per il cluster o SQL Warehouse, in particolare i valori Nome host server, Porta e Percorso HTTP.
Un token di accesso personale di Azure Databricks o un token Microsoft Entra ID (in precedenza Azure Active Directory). Per creare un token di accesso personale, seguire la procedura descritta in Token di accesso personali di Azure Databricks per gli utenti dell'area di lavoro.
Nota
Come procedura consigliata per la sicurezza, quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, Databricks consiglia di usare token di accesso personali appartenenti alle entità servizio, anziché agli utenti dell'area di lavoro. Per creare token per le entità servizio, consultare Gestire i token per un'entità servizio.
Passaggi per la connessione
Per connettersi manualmente a Dataiku, seguire Databricks nella documentazione di Dataiku.
Risorse aggiuntive
Esplorare le seguenti risorse di Dataiku: