Conecte-se à Dataiku
Dataiku é uma plataforma de IA de ponta a ponta para preparação de dados, AutoML e MLOps. Você pode integrar seus armazéns SQL do Databricks e clusters do Azure Databricks com o Dataiku.
Conecte-se à Dataiku usando o Partner Connect
Nota
O Partner Connect suporta apenas armazéns SQL para Dataiku. Para conectar um cluster ao Dataiku, conecte-se ao Dataiku manualmente.
Para conectar seu espaço de trabalho do Azure Databricks ao Dataiku usando o Partner Connect, faça o seguinte:
Na barra lateral, clique Marketplace.
Em integrações do Partner Connect, clique em Exibir todos os.
Clique no bloco de parceiro.
Nota
Se o bloco Dataiku tiver um ícone de marca de seleção dentro dele, um administrador já usou o Partner Connect para conectar o Dataiku ao seu espaço de trabalho. Pule para a etapa 5. O parceiro usa o endereço de email da sua conta do Azure Databricks para solicitar que você entre na sua conta Dataiku existente.
Selecione um catálogo na lista suspensa e clique em Avançar.
Nota
Se o seu espaço de trabalho estiver habilitado para Unity Catalog, mas o parceiro não oferecer suporte ao Unity Catalog com Partner Connect, o catálogo padrão do espaço de trabalho será usado. Se o seu espaço de trabalho não estiver habilitado para o Catálogo Unity,
hive_metastore
será usado.Selecione um esquema na lista suspensa e clique em Adicionar. Você pode repetir esta etapa para adicionar vários esquemas.
Clique em Next.
O Partner Connect cria os seguintes recursos no seu espaço de trabalho:
- Uma entidade de serviço do Azure Databricks chamada
<PARTNER>_USER
. - Um token de acesso pessoal do Azure Databricks associado à entidade de
<PARTNER>_USER
serviço.
O Partner Connect também concede os seguintes privilégios à
<PARTNER>_USER
entidade de serviço:- (Unity Catalog)
USE CATALOG
: Necessário para interagir com objetos dentro do catálogo selecionado. - (Catálogo Unity)
USE SCHEMA
: Concede a capacidade de ler os esquemas selecionados. - (Unity Catalog)
CREATE SCHEMA
: Concede a capacidade de criar esquemas no catálogo selecionado. - (Metastore do Hive herdado):
USAGE
Necessário para interagir com objetos dentrohive_metastore
e com os esquemas selecionados. - (metastore herdado do Hive)
CREATE
: Concede a capacidade de criar um schema emhive_metastore
. - (Metastore do Hive herdado) READ_METADATA: Concede a capacidade de ler metadados para os esquemas selecionados.
- (metastore herdado do Hive) SELECT: Concede a capacidade de ler os esquemas selecionados.
- Uma entidade de serviço do Azure Databricks chamada
Clique em Next.
A caixa Email exibe o endereço de email da sua conta do Azure Databricks. A Dataiku usa este endereço de e-mail para solicitar que você crie uma nova conta de parceiro ou entre em sua conta de parceiro existente.
Clique em Conectar à Dataiku ou Entrar.
Uma nova guia é aberta no seu navegador da Web, que exibe o site da Dataiku.
Preencha as instruções na tela no site da Dataiku para criar sua conta Dataiku de avaliação ou entrar em sua conta Dataiku existente.
Conecte-se ao Dataiku manualmente
Esta seção descreve como conectar um SQL warehouse ou cluster existente em seu espaço de trabalho do Azure Databricks ao Dataiku manualmente.
Nota
Para armazéns SQL Databricks, você pode se conectar ao Dataiku usando o Partner Connect para simplificar a experiência.
Requerimentos
Antes de se conectar ao Dataiku manualmente, você precisa do seguinte:
Um cluster ou armazém SQL no seu espaço de trabalho do Azure Databricks.
- Referência de configuração de computação.
- Crie um armazém SQL.
Os detalhes de conexão para o seu cluster ou SQL warehouse, especificamente os valores de Nome de Host do Servidor , Porta e Caminho HTTP .
Um token de acesso pessoal do Azure Databricks ou um token de ID do Microsoft Entra (anteriormente Azure Ative Directory). Para criar um token de acesso pessoal, siga as etapas em Tokens de acesso pessoal do Azure Databricks para usuários do espaço de trabalho.
Nota
Como prática recomendada de segurança, quando você se autentica com ferramentas, sistemas, scripts e aplicativos automatizados, o Databricks recomenda que você use tokens de acesso pessoal pertencentes a entidades de serviço em vez de usuários do espaço de trabalho. Para criar tokens para entidades de serviço, consulte Gerenciar tokens para uma entidade de serviço.
Etapas para se conectar
Para se conectar ao Dataiku manualmente, siga o Databricks na documentação do Dataiku.
Recursos adicionais
Explore os seguintes recursos da Dataiku: