Conexión a Dataiku
Dataiku es una plataforma de inteligencia artificial integral para la preparación de datos, Mosaic AutoML y MLOps. Puede integrar los almacenes de Databricks SQL y los clústeres de Azure Databricks con Dataiku.
Conectarse a Dataiku mediante Partner Connect
Nota:
Partner Connect solo admite el uso de almacenes SQL para Dataiku. Para conectar un clúster a Dataiku, conéctese a Dataiku manualmente.
Para conectar el área de trabajo de Azure Databricks a Dataiku mediante Partner Connect, haga lo siguiente:
En la barra lateral, haga clic en Partner Connect.
Haga clic en el icono de asociado.
Nota:
Si el icono de Dataiku tiene una marca de verificación dentro, significa que un administrador ya ha usado Partner Connect para conectar Dataiku al área de trabajo. Vaya al paso 5. El partner usa la dirección de correo electrónico de la cuenta de Azure Databricks para solicitarle que inicie sesión en su cuenta de Dataiku existente.
Seleccione un catálogo en la lista desplegable y, después, haga clic en Siguiente.
Nota:
Si el área de trabajo está habilitada para Unity Catalog, pero el asociado no admite Unity Catalog con Partner Connect, se usa el catálogo predeterminado del área de trabajo. Si el área de trabajo no está habilitada para Unity Catalog, se usa
hive_metastore
.Seleccione un esquema en la lista desplegable y, a continuación, haga clic en Agregar. Puede repetir este paso para agregar varios esquemas.
Haga clic en Next.
Partner Connect crea los siguientes recursos en el área de trabajo:
- Un nombre de entidad de seguridad de servicio de Azure Databricks
<PARTNER>_USER
. - Un token de acceso personal de Azure Databricks asociado con la
<PARTNER>_USER
entidad de servicio.
Partner Connect también concede los siguientes privilegios a la entidad de servicio
<PARTNER>_USER
:- (Catálogo de Unity)
USE CATALOG
: necesario para interactuar con objetos dentro del catálogo seleccionado. - (Catálogo de Unity)
USE SCHEMA
: concede la capacidad de leer los esquemas seleccionados. - (Catálogo de Unity)
CREATE SCHEMA
: concede la capacidad de crear esquemas en el catálogo seleccionado. - (Metastore de Hive heredado)
USAGE
: necesario para interactuar con objetos dentro dehive_metastore
y los esquemas seleccionados. - (Metastore de Hive heredado)
CREATE
: concede la capacidad de crear un esquema enhive_metastore
. - (Metastore de Hive heredado) READ_METADATA: Concede la capacidad de leer metadatos en los esquemas seleccionados.
- (Metastore de Hive heredado) SELECT: concede la capacidad de leer los esquemas seleccionados.
- Un nombre de entidad de seguridad de servicio de Azure Databricks
Haga clic en Next.
En el cuadro Correo electrónico se muestra la dirección de correo electrónico de su cuenta en Azure Databricks. Dataiku usará esta dirección de correo electrónico para solicitarle que cree una nueva cuenta de asociado o que inicie sesión en su cuenta de asociado existente.
Haga clic en Conectar a Dataiku o Iniciar sesión.
Se abre una nueva pestaña en el explorador web, que muestra el sitio web de Dataiku.
Complete las instrucciones en pantalla del sitio web de Dataiku para crear su cuenta de prueba de Dataiku o iniciar sesión en su cuenta de Dataiku existente.
Conexión manual a Dataiku
En esta sección, se describe cómo conectar manualmente un clúster o un almacén SQL existente del área de trabajo de Azure Databricks con Dataiku.
Nota:
Los almacenes de Databricks SQL pueden conectarse con Dataiku mediante Partner Connect para una experiencia más sencilla.
Requisitos
Para conectarse a Dataiku manualmente, deberá cumplir los siguientes requisitos:
Un clúster o almacén SQL en el área de trabajo de Azure Databricks.
Los detalles de la conexión del clúster o almacén SQL, concretamente los valores Nombre de host del servidor, Puerto y Ruta de acceso HTTP.
Un token de acceso personal de Azure Databricks o un token de Microsoft Entra ID (anteriormente, Azure Active Directory). Para crear un token de acceso personal, haga lo siguiente:
- En el área de trabajo de Azure Databricks, haga clic en el nombre de usuario de Azure Databricks de la barra superior y, a continuación, seleccione Configuración en la lista desplegable.
- Haga clic en Desarrollador.
- Junto a Tokens de acceso, haga clic en Administrar.
- Haga clic en Generate new token (Generar nuevo token).
- (Opcional) Escriba un comentario que le ayude a identificar este token en el futuro y cambie la duración predeterminada del token de 90 días. Para crear un token sin duración (no recomendado), deje el cuadro Duración (días) vacío (en blanco).
- Haga clic en Generar.
- Copie el token mostrado en una ubicación segura y, a continuación, haga clic en Listo.
Nota:
Asegúrese de guardar el token copiado en una ubicación segura. No comparta el token copiado con otros usuarios. Si pierde el token copiado, no podrá volver a generar ese mismo token. Debe repetir el procedimiento para crear un nuevo token. Si pierde el token copiado o cree que el token se ha visto comprometido, Databricks recomienda eliminar inmediatamente ese token del área de trabajo haciendo clic en el icono de papelera (Revocar) situado junto al token en la página Tokens de acceso.
Si no puede crear o usar tokens en el área de trabajo, puede deberse a que el administrador del área de trabajo tiene tokens deshabilitados o no le ha concedido permiso para crear o usar tokens. Consulte el administrador del área de trabajo o los siguientes temas:
Nota:
Como procedimiento recomendado de seguridad, cuando se autentique con herramientas, sistemas, scripts y aplicaciones automatizados, Databricks recomienda usar los tokens de acceso personal pertenecientes a las entidades de servicio en lugar de a los usuarios del área de trabajo. Para crear tókenes para entidades de servicio, consulte Administración de tokens de acceso para una entidad de servicio.
Pasos para establecer la conexión
Para conectarse manualmente a Dataiku, siga Databricks en la documentación de Dataiku.
Recursos adicionales
Explore los siguientes recursos de Dataiku: