Compartir a través de


Conexión a Dataiku

Dataiku es una plataforma de inteligencia artificial integral para la preparación de datos, AutoML y MLOps. Puede integrar los almacenes de Databricks SQL y los clústeres de Azure Databricks con Dataiku.

Conectarse a Dataiku mediante Partner Connect

Nota:

Partner Connect solo admite el uso de almacenes SQL para Dataiku. Para conectar un clúster a Dataiku, conéctese a Dataiku manualmente.

Para conectar el área de trabajo de Azure Databricks a Dataiku mediante Partner Connect, haga lo siguiente:

  1. En la barra lateral, haga clic en Botón Partner Connect Partner Connect.

  2. Haga clic en el icono de asociado.

    Nota:

    Si el icono de Dataiku tiene una marca de verificación dentro, significa que un administrador ya ha usado Partner Connect para conectar Dataiku al área de trabajo. Vaya al paso 5. El partner usa la dirección de correo electrónico de la cuenta de Azure Databricks para solicitarle que inicie sesión en su cuenta de Dataiku existente.

  3. Seleccione un catálogo en la lista desplegable y, después, haga clic en Siguiente.

    Nota:

    Si el área de trabajo está habilitada para Unity Catalog, pero el asociado no admite Unity Catalog con Partner Connect, se usa el catálogo predeterminado del área de trabajo. Si el área de trabajo no está habilitada para Unity Catalog, se usa hive_metastore.

  4. Seleccione un esquema en la lista desplegable y, a continuación, haga clic en Agregar. Puede repetir este paso para agregar varios esquemas.

  5. Haga clic en Next.

    Partner Connect crea los siguientes recursos en el área de trabajo:

    Partner Connect también concede los siguientes privilegios a la entidad de servicio <PARTNER>_USER:

    • (Catálogo de Unity)USE CATALOG: necesario para interactuar con objetos dentro del catálogo seleccionado.
    • (Catálogo de Unity) USE SCHEMA: concede la capacidad de leer los esquemas seleccionados.
    • (Catálogo de Unity)CREATE SCHEMA: concede la capacidad de crear esquemas en el catálogo seleccionado.
    • (Metastore de Hive heredado) USAGE: necesario para interactuar con objetos dentro de hive_metastore y los esquemas seleccionados.
    • (Metastore de Hive heredado) CREATE: concede la capacidad de crear un esquema en hive_metastore.
    • (Metastore de Hive heredado) READ_METADATA: Concede la capacidad de leer metadatos en los esquemas seleccionados.
    • (Metastore de Hive heredado) SELECT: concede la capacidad de leer los esquemas seleccionados.
  6. Haga clic en Next.

    En el cuadro Correo electrónico se muestra la dirección de correo electrónico de su cuenta en Azure Databricks. Dataiku usará esta dirección de correo electrónico para solicitarle que cree una nueva cuenta de asociado o que inicie sesión en su cuenta de asociado existente.

  7. Haga clic en Conectar a Dataiku o Iniciar sesión.

    Se abre una nueva pestaña en el explorador web, que muestra el sitio web de Dataiku.

  8. Complete las instrucciones en pantalla del sitio web de Dataiku para crear su cuenta de prueba de Dataiku o iniciar sesión en su cuenta de Dataiku existente.

Conexión manual a Dataiku

En esta sección, se describe cómo conectar manualmente un clúster o un almacén SQL existente del área de trabajo de Azure Databricks con Dataiku.

Nota:

Los almacenes de Databricks SQL pueden conectarse con Dataiku mediante Partner Connect para una experiencia más sencilla.

Requisitos

Para conectarse a Dataiku manualmente, deberá cumplir los siguientes requisitos:

Pasos para establecer la conexión

Para conectarse manualmente a Dataiku, siga Databricks en la documentación de Dataiku.

Recursos adicionales

Explore los siguientes recursos de Dataiku: