Connettersi a Dataiku
Dataiku è una piattaforma di IA end-to-end per la preparazione dei dati, AutoML e MLOps. È possibile integrare i warehouse SQL Databricks e i cluster Azure Databricks con Dataiku.
Connettersi a Dataiku tramite Partner Connect
Nota
Partner Connect supporta solo i warehouse SQL per Dataiku. Per connettere un cluster a Dataiku, connettersi manualmente a Dataiku.
Per connettere l'area di lavoro Azure Databricks a Dataiku utilizzando Partner Connect, procedere come segue:
Nella barra laterale, clicca sull'icona Marketplace
.
Nelle integrazioni di Partner Connect, cliccare su Visualizza tutto.
Fare clic sul riquadro Partner.
Nota
Se nel riquadro Dataiku è presente un'icona con un segno di spunta, significa che un amministratore ha già utilizzato Partner Connect per collegare Dataiku all'area di lavoro. Andare direttamente al passaggio 5. Il partner utilizza l'indirizzo e-mail dell'account Azure Databricks per richiedere l'accesso all'account Dataiku esistente.
Selezionare un catalogo dall'elenco a discesa e quindi fare clic su Avanti.
Nota
Se l'area di lavoro è abilitata per Unity Catalog, ma il partner non supporta Unity Catalog con Partner Connect, viene usato il catalogo predefinito dell'area di lavoro. Se l'area di lavoro non è abilitata a supportare Unity Catalog, viene usata
hive_metastore
.Selezionare uno schema dall'elenco a discesa e quindi fare clic su Aggiungi. È possibile ripetere questo passaggio per aggiungere più schemi.
Fare clic su Avanti.
Partner Connect crea le seguenti risorse nell'area di lavoro:
- Un’entità servizio di Azure Databricks denominata
<PARTNER>_USER
. - Un token di accesso personale di Azure Databricks associato all'entità servizio
<PARTNER>_USER
.
Partner Connect concede anche i seguenti privilegi seguenti all'entità servizio
<PARTNER>_USER
:- (Catalogo Unity)
USE CATALOG
: obbligatorio per interagire con gli oggetti all'interno del catalogo selezionato. - (Catalogo Unity)
USE SCHEMA
: concede la possibilità di leggere gli schemi selezionati. - (Catalogo Unity)
CREATE SCHEMA
: concede la possibilità di creare schemi nel catalogo selezionato. - (Metastore Hive legacy)
USAGE
: obbligatorio per interagire con gli oggetti all'interno dihive_metastore
e con gli schemi selezionati. - (Metastore Hive legacy)
CREATE
: concede la possibilità di creare uno schema inhive_metastore
. - (Metastore Hive legacy) READ_METADATA: concede la possibilità di leggere i metadati per gli schemi selezionati.
- (Metastore Hive legacy) SELECT: concede la possibilità di leggere gli schemi selezionati.
- Un’entità servizio di Azure Databricks denominata
Fare clic su Avanti.
Nella casella Posta elettronica viene visualizzato l'indirizzo di posta elettronica per l'account Azure Databricks. Dataiku usa questo indirizzo di posta elettronica per richiedere di creare un nuovo account partner o di accedere all'account partner esistente.
Fare clic su Connetti a Dataiku oppure su Accedi.
Verrà visualizzata una nuova scheda nel Web browser, che visualizza il sito Web di Dataiku.
Completare le istruzioni visualizzate nel sito Web di Dataiku per creare l'account Dataiku di valutazione o accedere all'account Dataiku esistente.
Connettersi manualmente a Dataiku
Questa sezione descrive come collegare manualmente a Dataiku un warehouse o un cluster SQL esistente nell'area di lavoro di Azure Databricks.
Nota
Per i warehouse Databricks SQL, è possibile connettersi a Dataiku utilizzando Partner Connect per semplificare l'esperienza.
Requisiti
Prima di connettersi manualmente a Dataiku, è necessario quanto segue:
Un cluster o SQL Warehouse nell'area di lavoro di Azure Databricks.
I dettagli di connessione per il cluster o SQL Warehouse, in particolare i valori Server Nome host, Portae Percorso HTTP.
Un token di accesso personale di Azure Databricks o un token Microsoft Entra ID (in precedenza Azure Active Directory). Per creare un token di accesso personale, seguire la procedura descritta in Token di accesso personali di Azure Databricks per gli utenti dell'area di lavoro.
Nota
Come procedura consigliata per la sicurezza, quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, Databricks consiglia di usare token di accesso personali appartenenti alle entità servizio, anziché agli utenti dell'area di lavoro. Per creare token per le entità servizio, consultare Gestire i token per un'entità servizio.
Passaggi per la connessione
Per connettersi manualmente a Dataiku, seguire Databricks nella documentazione di Dataiku.
Risorse aggiuntive
Esplorare le seguenti risorse di Dataiku: