Compartir vía


Azure Machine Learning como producto de datos para el análisis a escala de la nube

Azure Machine Learning es una plataforma integrada para administrar el ciclo de vida del aprendizaje automático de principio a fin, incluida la ayuda con la creación, el funcionamiento y el consumo de modelos y flujos de trabajo de aprendizaje automático. Entre las ventajas del servicio, se incluyen:

  • Funcionalidades que permiten a los creadores aumentar su productividad, ya que les ayudan a administrar los experimentos, acceder a los datos, realizar un seguimiento de los trabajos, ajustar los hiperparámetros y automatizar los flujos de trabajo.

  • La capacidad del modelo de ser explicado, reproducido, auditado e integrado con DevOps, además de un modelo de control de seguridad enriquecido, puede ayudar a los operadores a cumplir los requisitos de gobernanza y cumplimiento.

  • Las funcionalidades de inferencia administradas y la sólida integración con los servicios de proceso y datos de Azure pueden ayudar a simplificar cómo se consume el servicio.

Azure Machine Learning abarca todos los aspectos del ciclo de vida de la ciencia de datos. Abarca el almacén de datos y el registro del conjunto de datos para la implementación del modelo. Se puede usar para todos los tipos de aprendizaje automático, desde el clásico hasta el profundo. Incluye aprendizaje supervisado y no supervisado. Tanto si prefiere escribir código de Python o de R como si se decide por opciones con poco o ningún código, como el diseñador, puede crear, entrenar y realizar un seguimiento de modelos de aprendizaje automático y aprendizaje profundo precisos en un área de trabajo de Azure Machine Learning.

Azure Machine Learning, la plataforma de Azure y Azure AI pueden trabajar juntos para administrar el ciclo de vida del aprendizaje automático. Un profesional del aprendizaje automático puede usar Azure Synapse Analytics, Azure SQL Database o Microsoft Power BI para empezar a analizar datos y realizar la transición a Azure Machine Learning para crear prototipos, administrar la experimentación y la operacionalización. En las zonas de aterrizaje de Azure, Azure Machine Learning se puede considerar un producto de datos.

Azure Machine Learning en el análisis a escala de la nube

La base de la zona de aterrizaje de Cloud Adoption Framework (CAF), las zonas de aterrizaje del análisis de datos a escala de la nube y la configuración de Azure Machine Learning ponen a disposición de los profesionales del aprendizaje automático un entorno preconfigurado en el que pueden desplegar repetidamente nuevas cargas de trabajo de aprendizaje automático o migrar las existentes. Estas funcionalidades pueden ayudar a los profesionales del aprendizaje automático a lograr más agilidad y valor para su tiempo.

Los siguientes principios de diseño pueden guiar la implementación de zonas de aterrizaje de Azure Machine Learning:

  • Acceso a datos acelerado: preconfigure los componentes de almacenamiento de la zona de aterrizaje como almacenes de datos en el área de trabajo de Azure Machine Learning.

  • Colaboración habilitada: organice las áreas de trabajo por proyecto y centralice la administración de acceso para que los recursos de la zona de aterrizaje admitan que los profesionales de ingeniería de datos, ciencia de datos y aprendizaje automático trabajen juntos.

  • Implementación segura: como valor predeterminado para cada implementación, siga los procedimientos recomendados y use el aislamiento de red, la identidad y la administración de acceso para proteger los recursos de datos.

  • Autoservicio: los profesionales del aprendizaje automático pueden lograr más agilidad y organización explorando opciones para implementar nuevos recursos de proyecto.

  • Separación de preocupaciones entre la administración de datos y el consumo de datos: la identidad transferida es el tipo de autenticación predeterminado para Azure Machine Learning y el almacenamiento.

  • Aplicación de datos más rápida (alineada con el origen): se pueden preconfigurar las zonas de aterrizaje de Azure Data Factory, Azure Synapse Analytics y Databricks para su vinculación a Azure Machine Learning.

  • Observabilidad: el registro central y las configuraciones de referencia pueden ayudar a supervisar el entorno.

Información general sobre la implementación

Nota

En esta sección se recomiendan configuraciones específicas para el análisis a escala de la nube. Complementa la documentación de Azure Machine Learning y las mejores prácticas de Cloud Adoption Framework.

Organización y configuración de áreas de trabajo

Puede implementar el número de áreas de trabajo de Machine Learning que requieran las cargas de trabajo y para cada zona de aterrizaje que implemente. Las siguientes recomendaciones pueden ayudar a su configuración:

  • Implemente al menos un área de trabajo de Machine Learning por proyecto.

  • En función del ciclo de vida del proyecto de aprendizaje automático, implemente un área de trabajo de desarrollo (dev) para crear prototipos de casos de uso y explorar los datos al principio. Para el trabajo que requiere experimentación, prueba e implementación continuas, implemente un área de trabajo de ensayo y de producción.

  • Cuando se necesitan varios entornos para las áreas de trabajo de desarrollo, ensayo y producción en una zona de aterrizaje de datos, se recomienda evitar la duplicación de datos haciendo que cada entorno llegue a la misma zona de aterrizaje de datos de producción.

  • Para más información sobre cómo organizar y configurar los recursos de Azure Machine Learning, consulte Organización y configuración de entornos de Azure Machine Learning.

Para cada configuración de recursos predeterminada en una zona de aterrizaje de datos, se implementa un servicio de Azure Machine Learning en un grupo de recursos dedicado con las siguientes configuraciones y recursos dependientes:

  • Azure Key Vault
  • Application Insights
  • Azure Container Registry
  • Use Azure Machine Learning para conectarse a una cuenta de Azure Storage y la autenticación basada en identidades de Microsoft Entra para ayudar a los usuarios a conectarse a la cuenta.
  • El registro de diagnóstico se configura para cada área de trabajo y se configura en un recurso central de Log Analytics de escala empresarial. Esto puede ayudar a que se analicen el estado de los recursos y el estado de los trabajos de Azure Machine Learning de forma centralizada dentro y entre las zonas de aterrizaje.
  • Consulte ¿Qué es un área de trabajo de Azure Machine Learning? para más información sobre los recursos y las dependencias de Azure Machine Learning.

Integración con los servicios principales de la zona de aterrizaje de datos

La zona de aterrizaje de datos incluye un conjunto predeterminado de servicios que se implementan en la capa de servicios principales. Estos servicios principales se pueden configurar cuando Azure Machine Learning se implementa en una zona de aterrizaje de datos.

  • Conecte Azure Synapse Analytics o las áreas de trabajo de Databricks como servicios vinculados para integrar los datos y procesar los macrodatos.

  • De manera predeterminada, los servicios de lago de datos se aprovisionan en la zona de aterrizaje de datos y las implementaciones de productos de Azure Machine Learning incluyen conexiones (almacenes de datos) preconfiguradas para estas cuentas de almacenamiento.

Overview of data product analytics for Azure Machine Learning.

Conectividad de red

Las redes para implementar Azure Machine Learning en zonas de aterrizaje de Azure se establecen con los procedimientos recomendados de seguridad para Azure Machine Learning y los procedimientos recomendados de redes de CAF. Estos procedimientos recomendados incluyen las siguientes configuraciones:

  • Azure Machine Learning y los recursos dependientes están configurados para usar puntos de conexión de Private Link.
  • Los recursos de proceso administrados solo se implementan con direcciones IP privadas.
  • La conectividad de red con el repositorio de imágenes base públicas de Azure Machine Learning y los servicios de asociados como Azure Artifacts se pueden configurar en el nivel de red.

Administración de identidades y acceso

Tenga en cuenta las siguientes recomendaciones para administrar las identidades y el acceso de usuario con Azure Machine Learning:

  • Los almacenes de datos de Azure Machine Learning pueden configurarse para usar la autenticación basada en credenciales o identidades. Al usar el control de acceso y las configuraciones del lago de datos de Azure Data Lake Storage Gen2, configure los almacenes de datos para que usen la autenticación basada en identidades. Esto permite a Azure Machine Learning optimizar los permisos de acceso de usuario para el almacenamiento.

  • Use grupos de Microsoft Entra para administrar los permisos de usuario para los recursos de almacenamiento y aprendizaje automático.

  • Azure Machine Learning puede usar identidades administradas asignadas por el usuario para el control de acceso y limitar el intervalo de acceso a Azure Container Registry, Key Vault, Azure Storage y Application Insights.

  • Cree identidades administradas asignadas por el usuario para los clústeres de proceso administrados creados en Azure Machine Learning.

Aprovisionamiento de la infraestructura mediante autoservicio

Se puede habilitar y gobernar el autoservicio con directivas para Azure Machine Learning. En la tabla siguiente, se muestra un conjunto de directivas predeterminadas al implementar Azure Machine Learning. Para más información, consulte Definiciones de directivas integradas de Azure Policy para Azure Machine Learning.

Directiva Tipo Referencia
Las áreas de trabajo de Azure Machine Learning deben usar Azure Private Link. Integrada Ver en Azure Portal
Las áreas de trabajo de Azure Machine Learning deben usar identidades administradas asignadas por el usuario. Integrada Ver en Azure Portal
[Versión preliminar]: configurar los registros permitidos para las instancias de proceso especificadas de Azure Machine Learning. Integrada Ver en Azure Portal
Configurar las áreas de trabajo de Azure Machine Learning con puntos de conexión privados. Integrada Ver en Azure Portal
Configurar las instancias de proceso de Machine Learning para deshabilitar los métodos de autenticación locales. Integrada Ver en Azure Portal
Append-machinelearningcompute-setupscriptscreationscript Personalizado (zonas de aterrizaje de CAF) Ver en GitHub
Deny-machinelearning-hbiworkspace Personalizado (zonas de aterrizaje de CAF) Ver en GitHub
Deny-machinelearning-publicaccesswhenbehindvnet Personalizado (zonas de aterrizaje de CAF) Ver en GitHub
Deny-machinelearning-AKS Personalizado (zonas de aterrizaje de CAF) Ver en GitHub
Deny-machinelearningcompute-subnetid Personalizado (zonas de aterrizaje de CAF) Ver en GitHub
Deny-machinelearningcompute-vmsize Personalizado (zonas de aterrizaje de CAF) Ver en GitHub
Deny-machinelearningcomputecluster-remoteloginportpublicaccess Personalizado (zonas de aterrizaje de CAF) Ver en GitHub
Deny-machinelearningcomputecluster-scale Personalizado (zonas de aterrizaje de CAF) Ver en GitHub

Recomendaciones para administrar el entorno

Las zonas de aterrizaje del análisis de datos a escala de la nube esbozan la implementación de referencia para las implantaciones repetibles, que pueden ayudarle a establecer entornos gestionables y gobernables. Tenga en cuenta las siguientes recomendaciones para usar Azure Machine Learning para administrar el entorno:

  • Use Microsoft Entra para administrar el acceso a los recursos de aprendizaje automático.

  • Publique un panel de supervisión central para supervisar el estado de la canalización, el uso de proceso y la administración de cuotas para el aprendizaje automático.

  • Si tradicionalmente usa directivas integradas de Azure y necesita cumplir requisitos de cumplimiento adicionales, cree directivas de Azure personalizadas para mejorar la gobernanza y el autoservicio.

  • Para realizar un seguimiento de los costos de investigación y desarrollo, implemente un área de trabajo de Machine Learning en la zona de aterrizaje como un recurso compartido durante las primeras fases de exploración del caso de uso.

Importante

Use clústeres de Azure Machine Learning para el entrenamiento de modelos de nivel de producción y Azure Kubernetes Service (AKS) para implementaciones de nivel de producción.

Sugerencia

Use Azure Machine Learning para proyectos de ciencia de datos. Abarca el flujo de trabajo de un extremo a otro con subservicios y características, y permite la automatización total del proceso.

Pasos siguientes

Use la plantilla de Data Products Analytics y las instrucciones para implementar Azure Machine Learning y consulte la documentación y los tutoriales de Azure Machine Learning para empezar a crear sus soluciones.

Continúe con los cuatro artículos siguientes de Cloud Adoption Framework para más información sobre los procedimientos recomendados de implementación y administración de Azure Machine Learning para empresas: